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原 书 : Object-Oriented Programming With ANSI-C 


I 
wh 


来 源 : http://blog.csdn.net/besidemyself/article/details/6376405 

译 者 : besidemyself 
没有 能 解决 所 有 问题 的 编程 技术 。 
没有 只 产生 正确 结果 的 编程 语言 。 
没有 从 头 开始 每 个 项 目的 程序 员 。 
面向 对 戎 程序 设计 几乎 是 当今 包 治 百 病 的 一 一 虽然 它 已 经 发 展 了 超过 10 年 之 久 。 作 为 一 种 核 
心 语言 ， 一 些 技术 专家 对 它 的 研究 已 经 付出 很 多 ， 从 而 形成 了 很 好 的 编程 规则 ， 这 些 规则 我 
们 一 直 引 以 为 鉴 了 长 达 20 年 之 久 。C++ (Eiffel: Oberon-2 > Smalltalk... 由 你 选择 ) 是 一 种 新 
的 编程 语言 ， 因 为 它 是 面向 对 象 的 一 尽管 你 不 需要 使 用 它 或 许 你 不 想 用 (或 不 知道 怎么 
A) ， 但 是 你 却 能 够 使 用 平凡 的 ANSI-C (标准 化 ) 像 使 用 这 些 面向 对 外 语言 一 样 的 方便 。 在 


项 目 当 中 ， 仅 仅 面向 对 象 语言 允许 代码 重用 虽然 一 些 子 程序 的 思想 就 像 计算 机 的 发 展 历 
史 一 样 久 远 ， 好 的 程序 员 却 总 是 会 利用 工具 箱 或 库 来 使 用 这 些 子 程序 。 





这 本 书 的 本 意 并 不 是 赞扬 面向 对 象 程序 或 批判 老 的 编程 规则 。 我 们 只 是 简单 的 使 用 ANSI-C 来 
发 气 面 向 对 象 语言 是 怎么 实现 的 ， 技 巧 方法 是 什么 ， 为 什么 它 能 够 帮助 我 们 解决 比较 大 的 问 
题 ， 和 我 们 怎么 能 利用 普遍 性 方法 和 编程 来 更 早 的 捕获 错误 。 沿 着 这 么 一 个 宗旨 ， 我 们 会 邂 
逅 一 些 行 话 一 类 ， 继 承 ， 实 例 ， 链 接 ， 方 法 ， 对 象 ， 多 态 等 等 一 不 过 我 们 剥 去 其 神奇 的 外 
衣 ， 看 如 何 转 化 为 一 种 我 们 一 直 都 知道 和 做 过 的 事情 。 


我 很 乐意 的 发 握 ANSI-C (标准 化 ) 是 一 种 全 面 的 面向 对 象 语言 。 为 了 能 够 分 享 这 种 乐趣 ， 在 
你 开始 之 前 ， 你 需要 适当 的 对 ANSI-C 有 一 定 的 流利 程度 一 熟悉 结构 体 ， 指 针 ， 原 型 ， 并 且 掌 
握 函 数 指针 是 必须 的 。 贯 穿 全 文 ， 你 会 遇见 所 有 的 新 说 法 一 依照 Orwell 和 Webster 的 话 :“ 设 
计 是 为 了 缩小 思想 的 广度 一 并 且 我 会 尽力 证 明 它 是 怎样 的 结合 所 有 的 这 些 你 一 直 想 连续 使 用 
的 好 的 方法 ， 结 果 ， 你 很 可 能 成 为 一 个 精通 ANSI-C 的 程序 员 。 


前 六 章 建立 ANSI-C 面 向 对 象 程序 设计 的 基础 。 我 们 将 以 一 个 隐藏 抽象 数据 结构 的 很 精确 的 信 
息 开 始 ， 然 后 通过 结构 体 的 扩展 ， 基 于 动态 链接 和 代码 继承 的 方式 来 增加 功能 属性 。 最 终 把 
他 们 放 到 一 起 构成 一 个 可 继承 的 类 使 得 代码 更 加 容易 维护 。 


编程 需要 规则 。 好 的 程序 遵循 很 多 规则 ， 大 量 的 规则 ， 标 准 ， 自 我 防御 的 方式 往往 能 使 事情 
做 对 做 好 。 程 序 员 要 学 会 使 用 工具 。 优 秀 的 程序 员 编 写 工具 去 处 理 日 常 一 些 编程 例 程 。ANSI|- 
C 面向 对 象 程序 要 求 有 一 定数 量 固 定 的 代码 一 即 名 称 改变 ， 数 据 结 构 没 有 变 。 因 此 ， 在 第 七 
章 我 们 建立 了 一 个 小 的 预 处 理 器 创建 一 个 必须 的 样板 ， 它 更 像 另 外 一 种 新 的 面向 对 象 语言 
(也 许 是 yanoodl) 但 是 它 并 不 被 如 此 看 待 ，OOC (面向 对 象 程序 设计 ANSI-C) 拓 新 而 出 ， 
更 让 我 们 专注 于 在 解决 问题 上 使 用 创造 性 方面 的 一 种 新 技巧 。OOC 有 很 强 的 可 塑性 。 我 们 设 
计 出 它 ， 理 解 它 并 且 可 改变 它 ， 能 够 依照 我 们 的 意愿 去 写 ANSI-C 代 码 。 


接 下 来 的 章节 中 将 精炼 我 们 的 技术 。 在 第 八 章 节 ， 我 们 增加 了 动态 类 型 检查 预先 的 捕获 天 
常 。 第 九 章 中 我 们 编排 了 自动 初始 化 机 制 防止 其 它 缺 陷 类 的 产生 。 第 十 章 ， 我 们 介绍 了 多 态 
以 及 怎样 相互 协作 达到 简化 的 目的 。 例 如 : 产生 标准 主 程 序 的 日 常事 务 。 更 多 的 章节 将 与 使 
用 类 的 方法 ， 存 储 ， 和 加 载 结 构 体 数据 相关 联 ， 这 些 结构 体 数 据 遵循 一 致 性 策略 。 并 且 通 过 
襄 套 异常 处 理 器 系统 来 做 到 一 致 性 错误 恢复 自 念 。 


最 终 ， 在 最 后 一 章节 中 ， 我 们 避 开 ANSI-C 的 局 限 性 并 且 实 现 了 一 个 和 鼠标 操作 的 计算 器 ， 首 先 
对 于 curses 终端 ， 接 下 来 应 用 于 X Window 系统 (如 果 你 想 了 解 什么 事 curses 和 x window 
查阅 相关 资料 ) 。 这 个 例子 清晰 的 证 明了 我 们 使 用 类 和 对 象 所 做 的 设计 和 实例 的 优美 性 ， 虽 
然 我 们 必须 处 理 外 在 的 库 和 类 层次 特性 。 


在 每 个 章节 的 前 面 都 有 一 个 概要 说 明 ， 在 这 个 概要 中 我 会 给 出 一 个 纲要 ， 来 介绍 章节 中 的 主 
要 内 容 和 接 下 来 该 做 什么 ， 这 对 于 略 读 此 章 的 读者 很 有 帮助 。 大 部 分 章节 建议 做 一 下 练习 ; 
但 是 这 并 不 意味 着 很 正规 ， 因 为 我 们 是 从 零 开 始 建立 这 样 的 技术 。 我 已 经 避免 制造 和 使 用 庞 
大 的 类 库 ， 即 使 一 些 例 子 这 样 做 似乎 很 有 利 。 如 果 你 想 更 好 的 理解 面向 对 象 程序 设计 ， 掌 握 
这 项 技术 和 考虑 代码 设计 显得 尤为 重要 ; 依靠 其 他 人 的 类 库 来 做 开发 是 稍 后 小 菜 一 碟 的 事 。 


这 本 书 的 一 个 重要 的 组 成 部 分 是 附 上 了 代码 软盘 ---- 使 用 DOS 文 件 系 统 ， 包 含 了 单独 的 
SHELL 命 了 来 创建 所 有 章节 中 的 代码 。 软 盘 上 有 一 个 ReadMe 文件 ---- 再 你 生成 代码 之 前 先 来 
阅读 一 下 它 。 编 程 ， 就 像 使 用 如 diff 的 程序 ， 跟 踪 基 类 的 演变 对 你 会 很 有 好 处 的 。OOC 在 接 
下 来 的 章节 中 会 有 很 好 的 体现 。 


这 些 技术 的 描述 出 自我 对 C++ 的 觉悟 ， 当 我 需要 使 用 面向 对 象 技 术 去 实现 交互 式 编程 语言 时 。 
并 且 意识 到 在 C++ 中 不 能 铸造 一 个 便携 式 的 实例 。 我 转向 我 所 了 解 的 ， 即 ANSI-C， 我 能 够 完 
全 做 我 必须 做 的 。 我 已 经 在 教学 过 程 中 把 这 项 技术 分 享 给 很 多 人 人， 包括 我 的 工作 场所 。 而 且 

其 他 人 已 经 使 用 这 些 方 法 很 好 了 完成 了 他 们 的 工作 。 这 本 书 就 驻 留 于 此 ， 因 为 对 我 的 脚注 却 

显得 尤为 暗淡 。Brian Kernighan ， 我 的 出 版 社 ，Hans-Joachim Niclas 和 John 等 等 ， 并 没有 

鼓励 我 出 版 这 些 笔 记 (有 机 会 ， 在 适当 的 时 候 会 从 新 组 织 一 次 ) ， 我 感谢 他 们 以 及 帮助 我 去 

继续 这 本 书 的 人 人， 最后， 感谢 我 的 家 人 一 并且， 不 ， 面 向 对 象 机 制 不 会 取代 "切片 面包 ”。 


Hollage, October 1993 


Axel-Tobias Schreiner 


第 一 章 抽象 数据 类 型 一 一 信息 隐藏 


来 源 : http://blog.csdn.net/besidemyself/article/details/6376408 


译 者 : besidemyself 


1.1 数据 类 型 


数据 类 型 是 每 种 编程 语言 不 可 或 缺 的 一 部 分 。ANSI-C (标准 化 C) 拥有 一 些 基本 数据 类 

型 : int ， double 和 char 。 有 限 的 数据 类 型 几乎 不 能 满足 程序 员 的 要 求 ， 所 以 编程 语言 会 
提供 一 种 机 制 来 使 得 程序 员 使 用 这 些 基 本 的 预定 义 数据 类 型 构造 新 的 数据 类 型 。 一 个 简单 的 
应 用 就 是 构造 集合 ， 如 数组 ， 结 构 体 和 联合 体 。 而 指针 集 ， 依 照 C.A.R Hare 的 话 :“ 从 这 一 步 
起 ， 我 们 也 许 永 远 不 会 复苏 "允许 我 们 描述 和 操作 本 质 上 无 限 复杂 的 数据 。 


什么 才 是 真正 的 数据 类 型 呢 ? 我 们 可 以 发 表 不 同 的 观点 。 数 据 类 型 是 一 系列 值 的 集合 

char (字符 型 ) 数 据 类 型 拥有 256 个 不 同 的 值 ， int (HA) 数据 类 型 拥有 更 多 不 同 值 ， 
他 们 之 间 的 间隔 相等 ， 表 现形 式 多 少 有 点 像 数 学 中 的 自然 数 或 整数 ， 而 double ( 浮 点 数据 类 
型 ) 类 型 拥有 更 多 的 可 能 的 值 ， 类 似 数学 中 的 带 小 数 部 分 的 数 。 





有 选择 性 地 ， 我 们 能 够 定义 一 种 数据 类 型 作为 一 个 值 的 集合 加 上 一 系列 操作 来 做 一 些 事情 。 
典型 地 ， 定 义 的 这 些 值 计算 机 能 够 表示 ， 这 样 的 操作 过 程 能 够 翻译 成 机 器 指令 。 在 这 方 
面 ，int 型 在 标准 C 语 言 中 做 的 并 不 是 很 好 。 这 些 数据 的 集合 的 值 的 范围 可 能 随 着 不 同 机 器 
而 不 同 ， 操 作 方式 就 像 算 术 中 的 右 移 操作 ， 表 现形 式 可 能 不 尽 相同 。 


太 复 杂 的 例子 往往 不 能 得 到 有 效 的 说 明 。 我 们 可 以 典型 地 把 一 个 线性 列表 中 的 元 素 定 义 成 一 
个 结构 体 如 下 : 


typedef struct node { 
struct node “Next, 
Information... 
}node ; 


并 且 ， 对 于 这 个 列表 的 操作 ， 我 们 指定 列表 的 头 ， 如 下 : 


node * head (node * elt , const node * tail); 


然而 ， 这 样 的 应 用 是 非常 宛 余 的 ， 好 的 编程 规则 指示 我 们 隐藏 数据 项 的 表示 ， 仅 仅 声 明 操 作 
方法 。 


1.2 dh KAUE KA 


如 果 我 们 不 把 对 这 个 数据 类 型 的 表示 呈现 给 用 户 ， 则 我 们 称 这 个 数据 类 型 为 抽象 数据 类 型 。 
从 理论 的 角度 ， 要 求 我 们 通过 包含 可 能 性 操作 的 数学 表达 式 中 指定 数据 类 型 的 属性 。 例 如 ， 
我 们 从 队列 中 删除 一 个 我 们 先前 增加 的 元 素 ， 并 且 可 以 从 队列 中 以 相同 的 次 序 检索 我 们 增加 
的 元 素 。 


抽象 数据 类 型 为 程序 员 提供 了 很 强 的 便利 性 。 因 为 表达 式 不 是 定义 的 一 部 分 。 我 们 可 以 自由 
的 选择 更 简单 ， 更 有 效 的 方式 去 实现 。 如 果 我 们 能 够 正确 的 分 离 出 必要 的 信息 ， 那 么 对 数据 
类 型 的 使 用 和 实现 将 完全 的 独立 开 来 。 


抽象 数据 类 型 满足 了 “信息 隐藏 "和 “分 而 治之 ”的 良好 编程 规则 。 例 如 数据 项 表达 式 只 给 需 
要 知道 的 人 提供 ， 给 抽象 数据 类 型 的 实现 者 ， 而 不 是 用 户 。 通 过 使 用 抽象 数据 类 型 ， 我 们 可 
以 清晰 的 分 离 出 实现 者 和 使 用 者 的 不 同 任务 。 并 且 可 很 好 的 把 一 个 大 的 系统 分 解 成 各 个 小 的 
模块 。 





1.3 举例 一 一 集合 


由 此 ， 我 们 怎样 的 实现 一 个 抽象 数据 类 型 呢 ? 我 们 以 对 一 个 集合 中 的 元 素 操作 为 例 ， 使 用 操 
作 方 法 ， add (增加 ) > find (ÆR) ， 和 drop (MIK) 。 这 些 方法 均 用 于 集合 和 集合 中 
的 元 素 。 add 方法 向 集合 中 添加 一 个 元 素 ， 并 返回 要 添加 的 元 素 ， fin 方法 从 集合 中 查找 
间 定 的 元 素 ， 可 被 用 于 实现 来 判断 一 个 指定 的 元 素 是 否 在 集合 中 ， drop 方法 从 集合 中 删除 一 
个 元 素 。 


使 用 这 种 方式 ， 即 可 看 到 set (集合 ) 是 一 个 抽象 的 数据 类 型 。 现 在 声明 一 下 我 们 想 要 做 的 ， 以 
一 个 头 文件 set.h 开始 : 


#ifndef . USR SET_H_ 

#define . USR SET H_ 

extern const void * Object; 

void” add(void” set const void” element): 

void” find(const void” set,const void “element): 
void” drop(void “set,const void = element): 

int contains(const void” set,const void” element): 
tendif 


前 两 名 的 作用 可 使 编译 器 对 这 段 声 明 加 以 保护 处 理 。 无 论 头 文件 set.h 被 包含 多 少 次 ，C 编 
译 器 只 对 这 个 声明 编译 一 次 。 这 样 的 声明 头 文件 的 方法 是 很 标准 的 ，GNU C 预 处 理 器 能 够 识 
别 ， 而 且 当 保护 符号 (如 上 的 UsR SET H ) 被 定义 ， 则 保证 不 会 再 进入 保护 区 声明 的 代 
49 o 


set.h RZ 2 (2 SARA 57 我 们 几乎 不 可 能 发 党 和 想象 出 它 的 不 足 : set ($ 

合 ) 理所当然 代表 一 个 实例 ， 我 们 可 以 使 用 这 个 实例 来 做 很 多 事情 。 Add() 方法 传递 一 个 元 
素 ， 并 把 它 添加 到 集合 ， 并 且 返 回 所 添加 的 元 素 或 集合 中 已 经 存在 的 元 素 ; findo 在 指定 的 
集合 中 查找 元 素 ， 并 且 返 回 找到 的 元 素 ， 若 没有 找到 ， 则 返回 NULL (Z) ; drop) 定位 一 
个 元 素 ， 把 这 个 元 素 从 集合 中 删除 ， 并 且 返 回 删除 的 元 素 ; contains() 的 本 质 就 是 

把 find() 方法 所 查找 的 结果 转换 为 “ 趴 " 值 。 


通用 指针 类 型 void* 的 应 用 贯穿 全 文 。 一 方面 它 使 得 我 们 想 发 现 集合 到 底 是 什么 东西 成 为 不 
可 能 。 但 是 另 一 方面 它 允 许 我 们 向 如 ado 和 其 他 方法 中 传递 任意 类 型 的 数据 。 并 不 是 每 件 
事 都 会 拥有 像 集 合 和 集合 中 的 元 素 一 样 的 表现 形式 一 在 信息 隐藏 的 乐趣 中 我 们 牺牲 了 类 型 
的 安全 性 。 然 而 ， 我 们 可 以 在 第 八 章 看 到 这 样 的 应 用 会 非常 之 安全 。 





14 内 存 管理 


也 许 我 们 已 经 营 见 了 茶 些 东西 : 怎样 的 获得 一 个 集合 呢 ? set (KË) 是 一 个 指针 ， 并 不 是 
被 typedef 关键 字 定 义 的 类 型 ; 因此 我 们 不 能 把 set 定义 成 一 个 局 部 或 全 局 的 类 型 。 相 反 的 
我 们 只 是 使 用 指针 来 引用 集合 和 集合 中 的 元 素 ， 并且 建立 一 个 文件 new.h ， 并 声明 如 下 : 


Vol OT ENA CON SH VOTO REY PE 
void delete (void = item); 


就 像 set.n 文件 一 样 的 做 法 ， 文 件 被 预 处 理 器 符号 NEN H 保护 起 来 。 以 后 只 列 出 感 兴趣 的 部 
分 ， 所 有 的 源 代码 和 所 有 实例 的 代码 均 能 在 光碟 中 找到 。 


new() 接收 一 个 像 set 的 描述 符 ,传递 更 多 可 能 的 参数 用 于 初始 化 操作 ， 返 回 一 个 指向 新 数 
据 项 的 携带 描述 符 信息 的 指针 ° delete() 接受 一 个 由 new( ) 所 原先 产 生 的 指针 ， 并 回收 关 
联 的 资源 。 


new() 和 delete() 可 看 成 类 似 于 标准 CC 函数 calloc() 和 free) 。 如 果 的 确 是 ， 描 述 符 
得 能 够 指示 出 至 少 需要 申请 多 大 的 内 存 空间 。 


1.5 ( Object ) HË 


如 果 我 们 想 搜集 在 集合 感 兴趣 的 东西 ， 我 们 需要 另外 一 个 抽象 数 据 类 型 object EK 
件 object.h 中 有 如 下 描述 : 


extern const void * Object: /* new(Object); “7 
had khena(constavold a Const void bo) 


differ() 是 用 来 做 对 象 比 较 的 : Ap AT ZË Ra Së DJ KETË o GAER o AE 6 din dë ZY 
C 语 言 函 数 strcmp() 留 有 余地 : 因为 在 某 些 比较 中 我 们 也 许 选 择 返 回 一 个 整数 或 负数 的 值 来 
指示 排列 的 次 序 〈 正 序 或 倒叙 ) 。 


现实 生活 的 对 象 需要 更 多 的 功能 去 做 有 用 的 事情 。 此 刻 ， 我 们 约束 我 们 自己 只 对 集合 中 的 成 
员 (必须 品 ) 操作 而 已 。 如 果 我 们 建立 一 个 更 大 的 类 库 ， 我 们 将 看 到 所 谓 的 集合 一 实际 ， 包 
括 其 他 所 有 东西 一 均 是 一 个 对 象 。 从 这 个 观点 出 发 ， 很 多 的 对 象 包含 的 功能 其 实 都 是 无 条 件 
存在 的 。 


包含 头 文件 ， 和 库 人 信息， 抽象 数据 类 型 ， 我 们 能 够 写 一 个 main.c 的 应 用 程序 如 下 所 示 : 


tinclude <stdio.h> 
tinclude "New.h" 
tinclude "Object.h" 
tinclude "Set.h" 


int main) 
void” s=new(Set); 
void* azadd(s, nev(object)): 
void” bzadd(s, nev(object)): 
void” c=new(Object); 


if(contains(s,a)egcontains(s,b))£ 
puts('ok'): 
} 


if(contains(s,c))1 
puts("contains?"); 
} 


if(differ(a,add(s,a)))t{ 
pulsi dnffere. 
J 


if(contains(s,drop(s,a))){ 
puts(''drop2'): 


delete(drop(s,a)): 
delete(drop(s,a)): 


return 0; 


我 们 创建 了 一 个 结合 并 给 集合 中 添加 了 两 个 新 建 的 对 象 。 如 果 不 出 意外 ， 我 们 可 以 发 现 对 象 
会 在 集合 中 ， 并 且 我 们 不 会 再 发 现 其 他 的 新 对 象 。 程 序 的 运行 会 简单 得 打印 出 ok 。 


对 differ) 的 调用 会 证 明 出 这 样 的 语义 : 数学 上 的 集合 只 包含 集合 a 的 一 份 拷贝 ; 对 一 
个 元 素 的 重复 添加 必须 返回 已 经 加 入 的 对 象 ， 因 此 上 述 程序 的 differ() 为 假 。 相 似 的 ， 一 
旦 我 们 从 一 个 结合 删除 一 个 元 素 ， 它 将 不 会 再 存在 于 这 个 集合 中 。 


从 一 个 集合 中 删除 一 个 不 存在 的 元 素 将 返回 一 个 空 的 指针 传递 给 delete) 。 现 在 ， 我 们 已 
经 指示 出 free() 的 语义 且 必 须 是 合情合理 可 接受 的 。 


1.7 一 种 实现 机 制 Set (集合 ) 


main.c 会 编译 成 功 ， 但 在 连接 和 执行 之 前 ， 我 们 必须 实现 其 中 的 抽象 数据 类 型 和 内 存 管 理 。 
如 果 一 个 对 象 不 存储 信息 ， 且 每 个 对 象 最 多 属于 一 个 结合 ， 我 们 可 以 把 每 个 对 象 和 集合 当 
成 ， 小 的 ， 独 立 的 ， 正 整数 的 值 。 可 在 heap[] 中 通过 数组 下 标 来 索引 到 。 如 果 一 个 对 象 
(这 里 的 对 象 为 数组 元 素 的 地 址 ) 是 一 个 集合 的 成 员 ， 则 数组 元 素 的 值 代表 这 个 集合 。 对 象 
指向 包含 它 的 集合 。 





首先 的 解决 方案 是 非常 简单 的 ， 即 我 们 把 其 他 模块 与 set. 相 结合 。 集 合 对 象 集 有 相似 的 呈 
现 方式 。 因 此 ， 对 于 nwo 无 需 关注 类 型 描述 。 它 仅仅 从 数据 heap[] 中 返回 非 零 元 素 。 


vord neni (CONSE Vordi type) 
{ 
nie Jo) F /*&heap[1...]*/ 
for (p=heap+1;p<heap+MANY;++p){ 
if(1*p){/* 若 heap 中 的 某 个 元 素 为 9， 则 返回 这 个 指针 ， 并 把 值 设 为 MANY*/ 
break: 
} 
assert(p<heap+MANY ) ; 
KP-MANY: 
return pj 


我 们 是 用 @ 来 标记 heap[] 中 有 效 的 元 素 ; 因此 不 能 返回 heap[6] 的 引用 一 一 如 果 它 是 一 个 
集合 ， 而 集合 的 元 素 可 以 是 索引 值 为 o 的 对 象 。 

在 一 个 对 象 被 添加 到 集合 当中 之 前 ， 我 们 让 它 包含 无 效 的 索引 many ， 以 便于 new() 不 会 再 
次 返回 它 ， 请 不 能 误解 MANY 是 集合 的 一 个 成 员 。 

new() 能 够 使 用 完 内 存 。 这 是 很 多 “致命 性 错误 "的 其 中 一 个 。 我 们 可 以 简单 的 使 用 标准 化 C 
语言 宏 的 宏 assert() 来 标记 这 些 错误 。 一 个 更 理想 的 实现 方式 是 至 少 会 打印 合理 的 错误 信 
息 或 使 用 用 户 可 重 写 的 错误 处 理 机 制 的 通用 功能 。 这 也 是 我 们 的 目的 中 ， 编 码 技术 完整 性 的 
一 部 分 。 在 第 13 章 ， 我 们 会 介绍 一 种 通用 异常 处 理 的 技术 。 


delete() 必须 得 严 加 防范 空 间 针 的 传 入 。 通 过 设置 其 元 素 的 值 为 o 来 进行 heap[] PRA 
的 回收 。 


void delete (void * item) 


{ 
int* item=_item; 
if(item)£ 
assert(itemzheap 88 item, heaptMANY): 
“item-o: 
} 
} 


我 们 需要 统一 的 处 理 通用 指针 ; 因此 ， 给 每 个 通用 指针 的 变量 的 前 面 加 上 下 划 线 前 级 ， 然 后 
仅仅 使 用 它 初始 化 指定 类 型 的 局 部 变量 。 


一 个 集合 被 它 的 对 象 所 表示 。 集 合 中 的 每 个 元 素 指 向 它 的 集合 。 如 果 元 素 包 含 MANY ME 


可 以 被 添加 到 一 个 集合 中 。 否 则 它 已 经 属于 一 个 集合 的 元 素 了 。 因 为 我 们 不 多 许 一 个 对 象 必 
于 多 个 集合 。 


void” add(void” set,const void” element): 


{ 
int * set=_ set, 
const int f“element- element, 


assert(seizheap 88 setsheaptMANY): 
assert(*set==MANY); 
assert(element>heap&& element<heap+MANY); 


if(*element==MANY){ 
*(int*)element=set-heap; 


else{ 
assert(*element==set-heap); 
} 


return (void*) element; 


assert() 在 这 里 稍微 显得 逊色 : 我 们 只 关注 在 heap[] 内 的 指针 和 集合 不 属于 其 他 部 分 的 集 


合 ， 等 等 ， 数 组 元 素 的 值 应 该 为 MANY 。 


其 他 的 功能 都 是 很 简单 的 。 find() 只 查找 元 素 的 值 为 集合 索引 的 元 素 。 若 找到 ， 返 回 元 素 ， 


否则 返回 NULL ° 


void” find(const void” set,const void * element) 
{ 
const int* set= set; 
const int* felementz element, 
assert(set>heap && setsheaptMANY): 
assert(*set==MANY ); 
assert(element>heap && element<heap+MANY); 
assert(*element); 
return *element==set-heap?(void*)element:0; 


contains() 把 find() 的 结果 转换 为 丨 值 : 


int contains(const void* set,const void* element) 


{ 
} 


return find(_set,_element)!=0; 


drop() 依赖 于 findo 的 结果 ， 若 在 集合 中 查找 到 ， 则 把 此 元 素 的 值 标记 为 MANY ， 并 返回 


此 元 素 : 


void” drop(void “ set,const void “ element) 


t 


int” element-find( set, element): 
if(element)£ 

“element-MANY: 
} 


return element; 


如 果 我 们 深入 挖掘 ， 一 定 会 坚持 被 删除 的 元 素 要 不 包 
疑问 会 在 drop() 中 复制 更 多 find) 的 代码 。 


含 于 其 他 集合 中 。 在 这 种 情况 下 ， 毫 无 


我 们 的 实现 是 很 非 传统 的 。 在 实现 一 个 集合 时 似乎 不 需要 differ) 。 我 们 仍然 提供 它 ， 
为 我 们 的 程序 要 使 用 这 个 函数。 


inte danien (Const vord la Const vord =p) 


return a!=b; 


当 数 组 中 对 象 的 索引 不 同时 ， 这 个 对 象 必 然 是 不 同 的 ， 也 就 是 索引 值 就 能 区 分 它们 的 不 同 ， 
但 一 个 简单 的 指针 比较 已 经 足够 了 。 


I 对 于 这 个 问题 的 解决 我 们 还 没有 使 用 描述 符 set 和 object ， 但 是 不 
得 不 定义 它 以 使 我 们 的 编译 器 能 通过 。 





const void “ Setj 
const void * Object: 


我 们 在 main() 函数 中 使 用 上 述 指针 来 创建 集合 和 对 象 。 





不 需要 改变 set,h 中 的 接口 ， 我 们 来 改变 接口 的 实现 方式 。 这 次 使 用 动态 内 存 分 配 ， 使 用 结 
构 体 来 表示 集合 和 对 象 : 


struct Seti 
unsigned count: 


}; 
struct Object{ 


unsigned count: 
struct Set” inj 


}; 


count 用 于 跟踪 集合 中 的 元 素 的 计数 个 数 。 对 于 一 个 元 素来 说 ， count 记录 这 个 元 素 被 集合 
添加 的 次 数 。 如 果 我 们 想 递 减 count 值 ， 可 调用 drop() 方法 。 一 旦 一 个 元 素 的 count 值 
为 6 ， 我 们 就 可 以 删除 它 ， 我 们 拥有 一 个 包 ， 即 ， 一 个 集合 ， 集 合 中 的 元 素 拥有 一 个 

对 count 的 引用 。 


因为 我 们 使 用 动态 内 存 分 配 机 制 去 表示 集合 集 和 对 象 集 ， 所 以 需要 初始 化 set 和 object 描 
述 符 ， 以 便于 new) 能 够 知道 需要 分 配 多 少 内 存 : 


static const size t Set-sizeof(struct Set); 
static const size_t _Object=sizeof(struct Object); 


const void * Set=&_Set; 
const void * Object=&_0bject; 


new() 方法 现在 更 加 简单 : 


VOJO NEw (Const Vordi Eye Si) 


{ 
const size t size= “(const size t”')type: 
void” p=calloc(1, size); 
assert(p); 
return pr 
} 





delete() 可 直接 把 参数 传递 给 free() 
。 如 下 : (如 意 调用 ) 


标准 化 C 语 言 中 一 个 空 的 指针 可 以 传 进 free() 


void delete (void ”“ item) 


free( item): 


add() 方法 多 多 少 少 对 它 的 指针 自 变 量 比 较 信 任 。 它 会 增加 元 素 的 引用 计数 和 集合 的 引用 计 
数 。 


void” add(void* set,const void” element) 


{ 


struct Set *set= set,; 
struct Object” element=(void*) element; 


assert(set): 
assert(element): 


if(lelement-z-in)£ 
element -zinz-setj: 


} 
elsef 


j; 


++element->count; 
++set->count; 


assert(element->in==set); 


return element; 


find() 方法 仍然 会 检查 ， 一 个 元 素 是 否 指向 一 个 适当 的 集合 : 


void” find(const void” set,const void “ element) 


{ 
const struct Object” elementz element, 
assert(element): 
return element -zin-- set2(void')element:o: 
} 


contains() 方法 基于 find) 方法 来 实现 ， 仍 然 保 持 不 变 。 


E drop) 在 集合 中 找到 它 要 操作 的 元 素 ， 它 将 递减 元 素 的 引用 计数 和 元 素 在 集合 中 的 计 
数 。 如 果 引 用 计数 减 为 0， 这 个 元 素 即 被 从 集合 中 删除 : 


void” drop(void e set,const void “ element) 


{ 
struct Set* setz set,; 
struct Object” element=find(set,_element); 
if(element){ 
if(--element->count==0){ 
element->in=0; 
--set->count; 
return element; 
} 


现在 我 们 可 以 提供 一 个 新 的 方法 ， 用 来 获取 集合 中 的 元 素 个 数 : 


unsigned count(const void* set) 


{ 
const struct Set” setz set, 
assert(set): 
return set->count; 

} 


当然 啦 ， 直 接 让 程序 通过 读 对 象 .count 显得 比较 简单 ， 但 是 我 会 坚持 不 去 披露 集 这 样 的 实 
现 。 与 应 用 程序 重 写 临 界 值 的 危险 性 相 比 上 述 功能 的 调用 的 开销 是 可 忽视 的 。 


包 的 表现 与 集合 是 不 同 的 。 一 个 元 素 可 被 添加 多 次 ; 当 一 个 元 素 的 删除 次 数 等 于 其 被 添加 的 
次 数 时 ， 这 个 元 素 被 从 集合 中 删除 ， contains) 方法 仍然 能 够 找 着 它 。 测 试 程序 的 运行 结果 
如 下 : 


ok 
drop? 


1.9 总 结 


对 于 抽象 数据 类 型 ， 我 们 完全 隐藏 了 其 实现 的 细节 ， 例 如 应 用 程序 代码 中 数据 项 的 描述 。 


程序 代码 只 访问 头 文件 ， 在 头 文件 中 描述 符 指 针 表 示 数 据 类 型 ， 对 数据 类 型 的 操作 作为 一 种 
方法 被 声明 ， 此 方法 接收 和 返回 通用 指针 。 


描述 符 指针 被 传 进 通用 方法 new() 中 去 获得 一 个 指向 数据 项 的 指针 ， 这 个 指针 被 传 进 通用 方 
法 delete() 中 去 回收 关联 的 资源 。 


1.10 练习 


ae 


第 一 章 WAAMA 


第 二 草 动态 链接 和 泛 函 数 


来 源 : http://blog.csdn.net/besidemyself/article/details/6387915 


译 者 : besidemyself 
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让 我 们 来 实现 一 个 简单 的 字符 囊 数 据 类 型 ， 这 个 数据 类 型 将 在 接 下 来 的 集合 中 用 到 。 对 于 新 
的 字符 串 ， 我 们 分 配 一 个 动态 缓存 来 保存 字 文 本 。 当 这 个 字符 串 被 删除 时 ， 我 们 将 回收 其 所 
占用 的 内 存 缓冲 。 


new() 负责 创建 一 个 对 象 ， delete) 必须 回收 这 个 对 象 所 占用 的 资源 。 new() 预先 知道 它 
所 创建 的 资源 的 类 型 ， 因 为 它 的 第 一 个 参数 将 传递 对 这 个 对 象 的 描述 。 基 于 这 个 参数 ， 我 们 
可 以 使 用 一 系列 的 判断 语句 if 来 处 理 单个 不 同 的 要 创建 的 对 象 。 这 样 做 的 缺点 是 nen) 得 
完全 包含 对 每 个 支持 的 对 象 要 处 理 的 代码 。 


现在 new) 拥有 一 个 更 大 的 问题 。 它 负责 创建 对 象 并 且 返 回 对 象 的 指针 ， 这 个 指针 被 传递 
到 delete() ? 也 就 是 说 ， new( ) 必须 在 每 个 对 象 中 安装 特定 的 析 构 器 ë E e 最 明显 的 应 用 
是 使 用 一 个 指针 ， 指 向 特定 的 析 构 器 ， 这 个 析 构 器 是 类 型 描述 符 的 一 部 分 ， 被 传 进 new() 。 
到 目前 为 止 ， 我 们 需要 像 如 下 的 声明 : 

struct typef 


size_t size; /*size of an object*/ 
void (dtor) (vord); Z'hdestructor”7 


}; 
struct String{ 
char “text: f“dynamic stringi 
const void” destroy, Z”'locate destructor”7 
}; 
struct Seti 
. information... 
const void “ destroy, Z'locate destructor”7 
}; 


似乎 我 们 又 有 另外 一 个 问题 : 在 新 的 对 象 中 ， 有 人 需要 把 析 构 器 指针 dtor 从 类 型 描述 中 找 
NS) destroy 中 。 而 且 这 样 的 拷贝 在 不 同 的 对 象 的 类 中 会 放 到 不 同 的 位 置 。 





初始 化 工作 是 new) 的 一 部 分 ， 不 同 的 类 型 会 要 求 new) 干 不 同 的 工作 
要 不 同 的 参数 来 处 理 不 同 的 类 型 : 


new( ) 可 能 需 


nen(Set): /*make a set*/ 
nen(String, 'text'), /*make a string*/ 


对 于 初始 化 我 们 使 用 另外 一 个 指定 类 型 的 功能 函数 ， 这 个 函数 我 们 称 它 为 构造 器 。 因 为 构造 
器 和 析 构 器 都 是 类 型 指定 的 ， 不 需要 改变 ， 我 们 把 他 们 当成 类 型 描述 的 一 部 分 传递 给 new() 
函数 。 


注意 ， 对 于 一 个 对 象 自身 来 说 构造 器 和 析 构 器 并 不 是 用 来 担当 获取 和 释放 内 存 的 责任 一 这 
是 new() 和 delete() 的 工作 。 构 造 器 被 new) 调用 仅仅 用 来 初始 化 nen) 所 分 配 的 内 
存 。 对 于 一 个 字符 串 ， 这 需要 涉及 需要 另外 一 块 内 存 存储 文本 ， 但 是 对 于 struct String 自 
身 的 内 存 却 是 使 用 new() 来 分 配 的 。 这 个 空间 接 下 来 会 被 delete( ) 所 释放 。 然 而 

delete() 首先 会 调用 析 构 器 ， 析 构 器 是 对 构造 器 所 做 的 初始 化 进行 反 向 操作 。 这 步 完 成 后 才 
调用 delete() 释放 new() 所 分 配 的 内 存 。 


2.2 方法 ， 消 息 ， 类 和 对 象 


delete() 必须 能 够 在 不 知道 对 象 类 型 的 情况 下 定位 析 构 器 。 因 此 修正 了 2.1 部 分 的 声明 ， 我 
们 必须 坚持 指针 被 用 来 定位 析 构 器 ， 这 个 指针 必须 放 到 所 有 对 象 的 开始 处 传 进 delete() PO 
而 不 管 他 们 的 类 型 是 什么 。 


这 个 指针 应 该 指向 什么 呢 ? 如 果 所 有 我 们 所 拥有 的 是 一 个 对 象 的 地 址 ， 那 么 对 于 一 个 对 象 来 
说 ， 指 针 给 了 我 们 访问 指定 类 型 的 对 象 信息 ， 就 像 对 每 的 析 构 函数 一 样 。 似 乎 很 可 能 我 们 将 
要 创造 一 个 类 型 指定 的 功能 如 一 个 函数 用 来 显示 对 象 ， 或 者 一 个 对 象 的 比较 函数 differ() ， 
或 一 个 函数 clone() 去 创建 一 个 对 象 的 完全 拷贝 。 因 此 我 们 将 使 用 一 个 指针 指向 函数 指针 
表 。 


仔细 看 ， 我 们 会 意识 到 这 个 表 必 须 是 类 型 描述 的 一 部 分 ， 被 传 进 new ,显然 的 解决 问题 的 


E 米 
答案 就 是 让 对 象 指向 一 个 类 型 的 完全 描述 : 


F 


struct Class { 
size_t size; 
void * (* ctor) (void * self, va list * app); 
void * (* dtor) (void * self); 
void * (* clone) (const void * self); 
int (” differ) (const void “ self, const vordi ib); 


struct String { 
eonstvond ec ass US ENDE SE 
char * text; 


struct Set{ 
const void* class / must be first'7 


}; 


每 个 对 象 将 以 一 个 指针 开始 ， 这 个 指针 向 对 象 的 类 型 描述 表 ， 通 过 这 个 类 型 描述 表 ， 我 们 就 
可 以 定位 一 个 对 象 的 类 型 指定 信息 size 是 new() 所 分 配 的 对 象 所 占用 内 存 的 大 

小 ; .dtor 指向 被 delete() ( delete 用 来 销毁 对 象 ) 所 调用 的 析 构 器 ; 而 differ 指向 
一 个 函数 ， 这 个 函数 用 于 比较 对 象 。 


继续 往 下 看 ， 我 们 会 注意 到 ， 每 个 功能 都 是 以 对 象 而 存在 的 ， 通 过 对 象 来 选择 这 些 功能 。 只 
有 构造 函数 要 处 理 部 分 初始 化 内 存 区 域 工作 。 我 们 都 叫 这 些 功 能 为 一 个 对 象 的 方法 。 调 用 一 
个 对 象 的 方法 就 是 处 理 一 则 消息 ， 我 们 使 用 参数 self 来 标记 消息 接收 的 对 象 。 因 为 我 们 使 
用 基本 的 C 函数 功能 ，self 是 不 需要 作为 第 一 个 参数 而 传 进 的 。 


多 个 对 象 共享 相同 的 类 型 描述 符 ， 也 就 是 说 ， 他 们 需要 相同 数量 大 小 的 内 存 空间 ， 可 用 于 相 
同 的 方法 。 我 们 称 所 有 拥有 相同 的 类 型 描述 符 的 对 象 为 一 类 ; 单独 的 对 象 被 称 为 类 的 实例 。 
到 目前 为 止 ， 一 个 类 ， 一 个 抽象 数据 类 型 ， 可 能 的 值 与 操作 结合 的 集合 ， 即 ， 一 个 数据 类 
型 ， 这 些 是 极其 相似 的 。 


一 个 对 象 是 一 个 类 的 实例 ， 也 就 是 说 ， 它 拥有 一 个 描述 ， 这 个 描述 被 new() 所 分 配 的 内 存 所 
指示 ， 并 且 这 个 描述 被 类 的 方法 操作 。 普 遍 来 说 ， 一 个 对 象 是 特殊 数据 类 型 的 值 。 


2.3 选择 器 ， 动 态 链 接 ， 多 态 
谁 来 邮递 消息 呢 ? 构造 器 被 nwo 所 调用 ， 对 于 大 多 数 内 存 区 域 是 不 被 初始 化 的 : 


vord new (Const Vordi Gass man) 


{ 
const struct Class * class = _class; 
vordi p = calloc(1i, class -”- size): 


assert(p): 
* (const struct Class **) p = class; 


if (class -> ctor) 
va_list ap; 
va_start(ap, _class); 
p = class -> ctor(p, & ap); 


va_end(ap); 


} 


return pj 


在 一 个 对 象 的 起 始 地 方 ， struct Class 指针 的 存在 是 极其 重要 的 。 这 也 是 我 们 在 new) 中 
初始 化 它 的 原因 : 


如 上 图 右边 的 类 型 描述 class 在 编译 的 时 候 已 经 被 初始 化 。 对 象 是 在 运行 时 被 创建 的 ， 接 下 
来 图 中 的 虚线 关联 才 被 插入 。 在 语句 : 


“ (const struct Class **) p = class: 


Fo p 指向 对 象 的 内 存 区 域 的 起 始 位 置 。 我 们 对 p 进行 了 强制 类 型 转换 ， p 把 对 象 的 起 始 
位 置 当成 一 个 指针 ， 指 向 struct Class ， 即 把 参数 class 设置 为 这 个 指针 的 值 。 


接 下 来 ， 若 构造 器 是 类 型 描述 的 一 部 分 ， 我 们 调用 它 ， 并 把 其 返回 值 做 为 new() 的 结果 ， 即 
作为 一 个 新 的 对 象 返 回 。2.6 部 分 列 出 一 个 很 聪明 的 构造 器 ， 由 于 它 聪明 ， 所 以 能 够 对 它 自己 
的 内 存 管 理 作 出 决策 。 


注意 啦 ， 只 有 明确 的 可 见 函 数 如 new() 能 拥有 可 变 的 参数 列表 。 参 数列 表 被 va_list 的 变量 
ap 所 访问 ， ap 被 一 个 宏 va_start() 初始 化 ， 这 个 宏 在 stdarg.h 头 文件 。 new() 仅仅 
能 够 把 整个 参数 列表 传 进 构造 器 中 ; 因此 ， ,ctor 也 被 声明 成 拥有 va list 的 参数 ， 而 不 
是 它 私 有 的 参数 列表 。 由 于 我 们 接 下 来 要 在 好 多 函数 中 共享 源 参 数列 表 ， 因 此 我 们 只 传递 

ap 的 地 址 到 构造 器 中 一 一 当 它 返回 时 ，ap 指向 参数 列表 的 第 一 个 参数 ， 而 参数 列表 本 身 不 
会 被 改变 。 


delete() 假设 每 个 对 象 ， 也 就 是 说 ， 每 个 非 空 指针 ， 指 向 一 个 类 型 描述 。 如 果 类 型 描述 的 析 
构 器 存在 ， 则 调用 它 。 这 里 ， self 扮演 前 面 p 的 角色 。 我 们 使 用 局 部 变量 cp 来 进行 强 
制 类 型 转换 ， 并 从 self 中 获得 我 们 所 需要 的 信息 。 


void delete (void * self) 


t 
const struct Class ** cp = self; 
if (self && * cp && (* cp) -> dtor){ 
self = (* cp) -> dtor(self); 
} 
free(self); 
} 


析 构 器 ， 在 上 述 delete() 中 ， 也 会 获得 一 次 把 他 的 返回 值 传 进 free() 的 机 会 ， 如 果 构 造 器 
试 着 去 坎 骗 ， 则 析 构 器 会 有 更 改 的 机 会 ， 参 看 2.6 部 分 。 如 果 一 个 对 象 在 调用 delete() 的 时 
候 不 想 被 删除 ， 则 可 在 他 的 析 构 器 中 返回 一 个 空 指针 。 


所 有 其 他 的 方法 都 存储 在 类 型 描述 中 ， 并 以 相似 的 方式 被 调用 。 在 每 个 例子 中 ， 我 们 有 一 个 
单独 的 接收 对 象 self 且 我 们 通过 它 来 路 由 我 们 的 方法 调用 。 
int dinen conSEvold se COnTStEVOnd ey 


t 


const struct Class * const * cp = self; 


assert(self && * cp && (* cp) -> differ); 
return (* cp) -> differ(self, b); 


最 关键 的 部 分 ， 当 然 是 一 个 假设 ， 假 设 我 们 能 够 找到 一 个 类 型 描述 指针 “self ， 而 这 

个 *self 会 隐藏 在 任意 的 指针 self 下 面 。 此 时 此 刻 ， 至 少 ， 我 们 会 对 空 指 针 很 警惕 。 在 每 
个 类 型 描述 的 起 始 ， 我 们 将 存放 一 个 "魔法 数字 ”， 或 甚至 把 地 址 或 所 有 已 知 类 型 的 地 址 范围 与 
*self 相 比较 ， 但 是 ， 在 第 八 章 会 看 到 ， 我 们 将 做 更 严格 的 检查 。 


不 管 怎么 说 differ 列举 出 了 函数 调用 技术 怎么 被 动态 链接 或 后 期 链接 调用 的 原因 : 即 只 
要 我 们 能 够 在 一 开始 拥有 一 个 正确 的 类 型 描述 指针 ， 那 么 我 们 就 可 以 对 任意 的 对 象 使 
用 differ) 调用 。 这 个 函数 实际 上 被 调用 的 时 机 是 尽 可 能 的 晚 的 一 即 仅仅 在 实际 执行 期 间 


调用 ， 而 不 是 之 前 调用 。 


我 们 可 以 称 differ() 为 一 个 选择 器 。 它 是 多 态 功能 的 一 个 例子 ， 也 就 是 说 ， 一 个 函数 能 够 接 
受 不 同 的 参数 类 型 ， 且 表现 不 同 ， 并 且 这 种 现象 是 基于 他 们 的 参数 类 型 。 一 旦 我 们 实现 了 更 
多 的 类 时 ， 这 些 类 在 他 们 的 描述 符 中 都 包含 differ ， 则 可 称 differ() 为 一 个 泛 函 数 ， 且 
在 这 些 类 中 能 够 被 应 用 于 任何 对 象 。 


我 们 可 以 把 这 个 选择 器 当成 方法 ， 方 法 自己 本 身 不 会 动态 链接 ， 但 仍然 能 够 像 多 态 函 数 一 样 
的 表现 ， 因 为 它 能 让 动态 的 连接 的 函数 做 他 们 丨 实 的 事情 。 


多 态 机 制 实际 已 经 诅 入 到 很 多 编程 语言 中 ， 例 如 : 如 在 Pascal (一 种 编程 语言 ) 

中 ，write() 函数 会 根据 参数 类 型 不 同 进行 不 同 的 处 理 。 在 C++ 中 ， 操 作 符 + 如 果 被 不 同 的 
类 型 值 如 整 型 ， 指 针 ， 浮 点 指针 调用 ， 将 产生 不 同 的 结果 。 这 个 现象 被 称 作 重 载 ， 即 : 参数 
类 型 和 操作 符 名 结合 起 来 决定 操作 结果 。 相 同 的 操作 符 与 不 同 的 参数 类 型 结合 将 产生 不 同 的 
响应 。 

这 里 并 没有 明显 的 差异 。 因 为 动态 连接 ， differ() 的 表现 更 像 一 个 重 载 函 数 ， 而 且 C 的 编译 
器 也 能 够 使 得 + 看 起 来 像 多 态 函 数 一 一 至 少 对 于 内 骨 的 数据 类 型 来 说 。 然 而 ，C 编 译 器 能 够 根 
据 对 + 操作 符 的 不 同 使 用 而 产生 不 同 的 返回 类 型 ， 但 是 函数 differ() 依靠 它 的 参数 类 型 只 能 
返回 相同 的 类 型 。 

很 多 方法 在 不 需要 动态 连接 的 情况 下 能 够 实现 多 态 。 例 如 ， 函 数 sizeof) 返回 任意 类 型 的 
对 象 的 大 小 。 


size t sizeof (const void * self) 


t 
const struct Class * const * cp = self; 
assert(self && * cp); 
return (~ cp) > SIze; 
} 


所 有 的 对 象 都 携带 它们 的 描述 符 ， 我 们 可 以 使 用 描述 符 来 获得 对 象 的 大 小 。 注 意 如 下 的 不 同 
ZA i 


void” sznen(string, "text"); 
assert(sizeof sizsizeof(s)): 


sizeof 是 C 语 言 的 操作 符 ， 用 于 在 运行 时 以 字 节 的 个 数 返回 参数 的 大 小 。 而 sizeof() 是 我 
们 实现 的 多 态 函 数 ， 它 的 参数 指向 一 个 对 象 ， 返 回 在 运行 时 对 象 所 占用 的 字 节 大 小 。 


2.4 应 用 


然而 我 们 还 没有 实现 一 个 字符 囊 类 ， 我 们 仍然 做 好 了 一 个 简单 的 测试 程序 的 准备 。 string.h 
定义 了 抽象 数据 类 型 : 


extern const void * String; 


对 于 所 有 的 对 象 ， 我 们 的 方法 都 是 相似 的 。 我 们 向 内 存 管理 头 文件 new.h 中 增加 在 1.4 部 分 
介绍 的 声明 : 


void “ (* clone) (const void * self): 
int (” differ) (Const void ”“ self, const void “ b): 


size_t sizeof(const void” self); 


前 两 个 源 型 声明 称 为 选择 器 ， 它 们 在 相关 的 struct Class 中 声明 。 下 面 是 其 应 用 : 


int main () 


{ 
void * a = new(String, "a"), * aa = clone(a); 
void * b = new(String, "b"); 
printf("sizeof(a) == %lu/n", (unsigned long)sizeof(a)): 
if (differ(a, b)){ 
puts(''ok'): 
} 
if (differ(a, aa)){ 
puts(''differ2'): 
if (a == aa){ 
puts(''clone2'): 
3 
delete(a), delete(aa), delete(b): 
return 07 
} 


我 们 创建 了 两 个 字符 串 ， 并 且 找 贝 了 其 中 一 份 。 我 们 打印 出 string 对 象 所 占用 的 大 小 一 一 并 
不 是 对 象 的 控制 文本 所 占用 的 大 小 。 最 终 ， 检 查找 贝 的 对 象 与 对 象 本 身 相等 ， 但 并 不 相同 ， 
最 后 再 次 删除 字符 串 对 象 。 如 果 所 有 的 程序 均 以 实现 ， 程 序 的 运行 结果 如 下 : 


size0f(a)==8 
ok 





2.5 实现 String 


我 们 通过 写 这 些 方法 实现 字符 串 ， 这 些 方法 需要 被 放 入 类 型 描述 string 中 。 对 于 实现 一 个 新 
的 数据 类 型 ， 动 态 连接 使 我 们 清晰 的 确定 出 那些 功能 函数 需要 实现 。 


构造 器 从 新 获得 文本 ， 传 递 给 new() ， 并 把 这 些 动态 拷贝 存储 进 通 过 nen) 创建 
的 struct String 中 8 


struct String { 


const void “ class: 7” must be first “7 
char * text; 


}; 


static vord A Stringsctorn (Vorde self vya List app) 
{ struct String * self = _self; 
const char * text = va_arg(* app, const char *); 


self -> text = malloc(strlen(text) + 1); 
assert(self -> text); 

strcpy(self -> text, text); 

return self; 


在 构造 器 中 ， 我 们 紧 紧 需要 初始 化 text 因为 new() 已 经 建立 了 .class 。 


析 构 器 释放 被 字符 囊 控制 的 动态 内 存 。 由 于 delete() 只 在 self 为 非 空 的 情况 下 调用 析 构 器 ， 
所 以 我 们 不 需要 做 其 他 参数 检查 ， 代 码 如 下 : 


static void “ String dtor (void “ self) 
{ struct String * self = _self; 


free(self -> text), self -> text = 0: 
return self; 


String_clone() 是 对 字符 串 的 一 个 拷贝 。 接 下 来 ， 源 和 源 的 拷贝 都 将 被 传 进 delete() 中 ， 
因此 我 们 必须 对 字符 囊 的 文本 做 一 个 动态 内 存 的 拷贝 。 这 个 工作 通过 调用 new() 很 容易 实 
现 。 


static void = String clone (const vord so) 
{ const struct String * self = self; 


return new(String, self -> text); 


毫 无 疑问 ， 对 于 string differ 如 果 我 们 比较 同一 个 字符 串 对 象 ， 则 返回 假 ， 若 果 我 们 比较 
两 个 不 同 的 字符 串 对 象 ， 返 回 夏 ， 如 果 我 们 想 比 较 字 符 串 文本 的 差异 可 试 着 使 用 strcmp() : 


static int string dinten (Const vordi oser Const vord map) 
{ const struct String * self = _self; 
const struct String * b = _b; 


if (self == b) 
return oy 
if (! b || b -> class != String) 
KE EU 
return stremp(self -> text, b -> text); 


类 型 描述 符 是 独一无二 的 一 一 这 里 我 们 要 确定 一 个 因素 ， 即 : 我 们 的 第 二 个 参数 是 否 为 字符 
串 文 本 。 


所 有 这 些 方法 都 应 该 使 用 关键 字 static 来 修饰 。 因 为 这 些 方法 只 能 通过 nen) 
和 delete) ， 或 者 选择 器 调用 。 对 于 通过 类 型 描述 符 的 方式 指定 的 选择 器 都 是 可 用 的 方法 。 


tinclude “new.r” 

static const struct Class  String = 1 
sizeof (struct String), 
String_ctor, String_dtor, 
String_clone, String_differ 

}; 


const void * String = 8 _String; 


在 String.h 中 声明 String.c 中 包含 的 公有 方法 ，new.h 中 声明 new.c 中 包含 的 公有 方法 。 以 便于 
正确 的 初始 化 类 型 描述 符 ， 这 里 也 包含 了 一 个 私有 的 头 文件 new.r ， 此 文件 中 包含 了 2.2 部 分 
定义 的 struct Class 类 型 描述 。 


2.6 为 一 种 实现 原子 

为 了 列举 我 们 通过 构造 器 和 析 构 器 到 底 能 够 做 什么 ， 我 们 实现 了 原子 ， 所 谓 原子 就 是 一 个 唯 
一 的 字符 窜 对 象 ; 如 果 两 个 原子 包含 相同 的 字符 窜 ， 则 他 们 是 相等 的 。 原 子 是 很 容易 比较 
的 : 如 果 两 个 参数 的 指针 不 同 ， 则 differ() 返回 夏 。 原 子 的 构造 和 销毁 要 付出 一 定 的 代 
价 ; 我 们 为 所 有 的 原子 维持 了 一 个 循环 链表 ， 并 计数 原子 被 克隆 的 次 数 ， 如 下 i: 





struct String { 
const void * class, ($ must be first “7 
char m text; 
struct String * next; 
unsigned count; 


}; 
static struct String * ring; J AT EU SEES A 


static void “ String clone (const void “ self) 
{ struct String * self = (void *) _self; 


tt self -> count; 
return self; 


所 有 的 原子 的 循环 链表 被 ring 所 标记 ， 通 过 它 的 成 员 .next 来 扩展 ， 并 使 用 构造 器 和 析 构 
器 来 维持 。 在 构造 器 保存 文本 之 前 ， 首 先 会 遍历 链表 是 否 有 相同 的 文本 已 经 存在 ， 如 下 的 代 
码 插 入 到 string_ctor() 之 前 : 


if (ring) 
1 


struct String * p = ring; 
do{ 
if (strcmp(p -> text, text) == 0) 


tt p > count, 
free(self): 
return pj 
} 
}while ((p = p -> next) != ring); 
} 
else{ 


} 
self -> next = ring -> next, ring -> next = self; 
self -> count = 1; 


ring = self; 


如 果 我 们 找到 了 相同 文本 的 原子 ， 则 增加 它 的 引用 计数 count 值 ， 释 放 新 的 对 象 self 返回 
当前 找 的 的 原子 指针 p 。 和 否则 我 们 向 循环 链表 中 插入 一 个 新 字符 串 对 象 并 设置 其 引用 计数 
为 count 为 1 © 


析 构 器 防止 删除 引用 计数 为 非 零 的 原子 。 如 下 的 代码 被 插入 到 string dtor() 之 前 : 


if (-- self -> count > 0){ 
return 0, 


assert(ring); 
if (ring == self)t{ 
ring = self -> next; 


} 
if (ring == self)t{ 
ring = 0; 
} 
elsef 
struct String * p = ring; 
while (p -> next != self){ 
p = p -> next; 
assert(p != ring); 
} 


p -> next = self -> next; 


如 果 对 引用 计数 的 减 1 操作 计数 扔 为 正 数 ， 则 返回 一 个 空 指针 ， 以 便于 delete) 手下 留情 。 
否则 如 果 我 们 的 字符 串 对 象 是 最 后 一 个 对 象 我 们 清除 循环 链表 标记 符 ， 否 则 从 链表 中 删除 我 
们 的 字符 串 。 


和 实现 加 入 到 2.4 的 程序 中 ， 注 意 ， 对 一 个 字符 串 对 象 的 克隆 此 时 为 源 字 符 囊 对 象 本 


sizeof(a)--i6 
ok 
clone? 


2.7 Shë 


给 一 个 指针 指 o ， 动态 连接 使 我 们 找到 了 类 型 指定 的 函数 功能 : 每 个 对 象 都 会 以 一 
个 描述 符 开 始 ， 这 个 描述 符 包含 了 指针 ， 指 向 对 象 的 可 用 函数 指针 表 。 尤 其 是 ， 一 个 描述 符 
i ， 这 个 构造 器 用 来 初始 化 对 象 所 关联 的 内 存 区 域 ， 另 外 这 个 指针 
还 指向 一 个 析 构 器 ， 析 构 器 会 在 删除 对 象 之 前 回收 对 象 所 拥有 的 资源 。 


我 们 称 所 有 的 对 象 所 共享 的 描述 符 为 一 个 类 。 而 对 象 是 类 的 实例 ， 对 于 对 象 指定 类 型 的 功能 
被 称 作 对 象 的 方法 ， 而 消息 被 这 些 功能 函数 所 调用 。 对 于 一 个 对 象 ， 我 们 使 用 选择 器 功能 去 
定位 和 调用 动态 连接 的 方法 。 

通过 选择 器 和 动态 连接 使 得 相同 函数 名 对 于 不 同 的 类 而 产生 不 同 的 结果 。 这 样 的 函数 被 称 为 
是 多 态 的 。 


多 态 功能 是 非常 有 用 的 。 他 们 提供 了 一 种 概念 上 的 抽象 : differ() 可 比较 任何 
我 们 不 需要 铭记 differ() 针对 具体 的 情形 是 否 可 用 。 一 个 很 容易 并 非常 o 
多 态 函 数 store() ， 可 在 一 个 文件 描述 符 上 显示 任何 对 象 。 





8 练习 
了 解 了 多 态 的 功能 后 ， 我 们 需要 使 用 动态 连接 来 实现 object 和 set 。 这 对 于 set 来 说 是 
比较 困难 的 。 我 们 不 再 记录 一 个 元 素 属于 哪个 集合 。 
对 于 字符 惠 来 说 ， 似 乎 有 更 多 的 方法 去 实现 。 我 们 需要 知道 字符 囊 的 长 度 ， 我 们 更 想 为 一 个 
对 象 从 新 设置 它 的 字符 串 文本 ， 我 们 应 该 能 打印 字符 囊 文本 。 如 果 我 们 乐意 去 处 理子 事 ， 将 
会 更 加 有 趣味 。 
原子 是 如 此 有 效 的， 我 们 可 使 用 一 个 哈 希 表 来 跟踪 它 ， 那 么 一 个 原子 的 值 能 否 被 改变 呢 ? 
string_clone() 呈现 出 一 个 微妙 的 问题 : 在 这 个 函数 中 ， string 的 值 似乎 应 该 
与 self->class 相同 。 我 们 向 new() 中 传递 的 参数 会 有 任何 变化 吗 ? 


第 三 章 编程 的 悟性 一 一 算术 表达 式 


来 源 : http://blog.csdn.net/besidemyself/article/details/6423491 
译 者 : besidemyself 


动态 连接 就 其 本 身 而 言 是 一 项 强大 的 编程 技术 ， 并 不 是 去 写 一 些 带 有 庞大 的 switch 语句 去 处 
理 很 多 特例 的 函数 。 我 们 可 以 写 很 多 小 的 函数 ， 对 于 每 个 case 语句 ， 安 排 适 当 的 函数 被 动 
态 连 接 调用 。 这 样 做 通常 简化 了 编程 工作 并 且 会 使 得 代码 容易 扩展 。 


作为 一 个 例子 ， 我 们 将 写 一 个 小 的 程序 去 读 并 评估 由 浮 点 数字 ， 括 号 ， 常 用 操作 符 ， 减 号 ， 
等 组 成 的 算术 表达 式 。 正 常情 况 下 我 们 宁愿 使 用 编译 器 产生 器 工具 lex 和 yacc KË ZILI 
分 的 程序 去 剖析 算术 表达 式 。 这 不 是 一 本 关于 编译 器 建立 的 书 ， 然 而 ， 就 仅仅 此 次 我 们 将 自 
已 写 这 次 的 代码 。 


3.1 主人 循环 


程序 的 主 循环 从 标准 输入 读 取 一 行 数据 ， 初 始 化 以 便 数字 和 操作 符 能 被 提取 出 来 ， 空 格 被 忽 
略 ， 调 用 一 个 函数 去 确认 正确 的 算术 表达 式 并 存储 之 ， 最 终 处 理 所 存 储 的 表达 式 。 如 果 出 错 
了 ， 我 们 简单 的 读 取 下 一 行 数据 。 如 下 为 主 循环 : 

tinclude <setjmp.h> 

int main (void) 


volatile int errors = 0; 
char buf [BUFSIZ]; 


if (setjmp(onError)){ 


++ errors; 


while (fgets(buf, sizeof buf, stdin)){ 
if (scan(buf)) 
{ void * e = sum(); 


if (token){ 
error("trash after sum"); 


process(e); 


delete(e); 
} 
} 
return errors > 0; 
void error (const char * fmt, ...) 


va_list ap; 


va_start(ap, fmt); 

vfprintf (stderr, fmt, ap), putc('7n', stderr); 
va_end(ap); 

longjmp(onError, 1); 


错误 恢复 点 被 使 用 setjmp() 所 定义 。 如 果 error() 在 程序 中 的 某 个 位 置 被 调 

用 ， longjmp() 伴随 着 从 setjmp() 另外 一 个 返回 而 继续 执行 。 在 这 种 情况 下 ， 结 果 是 一 个 
值 被 传 进 longjmp() ， 错 误 累 加 ， 而 且 下 一 个 输入 行 被 读 取 。 如 果 遇 到 错误 ， 程 序 的 出 口 代 
码 将 报告 错误 。 


3.2 扫描 器 


在 主 循环 中 ， 一 旦 一 个 输入 行 被 读 入 到 buf[] 中 ， 它 将 被 传 进 scan() ,此 函数 对 于 每 一 个 调 
用 把 下 一 个 输入 符号 放 入 变量 token 。 在 最 后 一 行 ， token 的 值 为 0 : 


tinclude <ctype .h> 
tinclude <errno.h> 
tinclude <stdlib.h> 
tinclude “parse.h” 


static double number; /* if NUMBER: numerical value */ 
static enum tokens scan (const char * buf) 


static const char * bp; 


if (buf){ 
bp = buf; /* new input line */ 
} 
while (isspace(* bp & Oxff)){ 
++ bp; 
} 
if (isdigit(* bp & Oxff) || * bp == '.') 


errno = 0; 
token = NUMBER, number = strtod(bp, (char **) & bp); 
if (errno == ERANGE){ 
error("bad value: %s", strerror(errno)); 
} 


3 
elset 
token = * bp 2 * bp tt : 0; 


return token; 


我 们 调用 scan) ， 可 传递 输入 行 缓 冲 的 地 址 ， 或 传 进 一 个 空 指针 得 以 继续 工作 在 当前 的 

行 。 空 格 被 忽略 ， 并 且 遇 到 第 一 个 为 数字 或 小 数 点 ， 我 们 就 是 用 一 个 ANSI-C 的 函数 

strtod() 开始 提取 出 浮 点 数字 。 若 为 其 他 的 任何 字符 将 被 返回 ， 并 且 我 们 不 会 预先 在 输入 缓 
冲 传 递 一 个 空 字 节 。 


scan() 的 结果 被 存储 在 全 局 变量 token 这 样 简化 了 识别 程序 (识别 器 ) 。 如 果 我 们 侦 
测 出 一 个 数字 ， 我 们 将 返回 唯一 的 值 NUMBER 并 使 得 在 全 局 变量 number 中 实际 的 值 有 效 。 





3.3 识别 器 


在 最 高 水 平 ,表达 式 通过 函数 sum() 被 识别 ， Sum( ) 函数 内 部 调用 scan() 并 返回 一 个 表 
示 ， 这 个 表示 可 通过 调用 process() 被 处 理 并 通过 delete() 被 回收 。 


\ 


如 果 我 们 不 使 用 yacc (是 Unix/Linux 上 一 个 用 来 生成 编译 器 的 编译 器 (编译 器 代码 生成 

器 ) ) ， 我 们 将 通过 递归 下 降 的 方法 识别 表达 式 ， 合 乎 语义 的 规则 被 翻译 成 等 价 的 C 函 数 。 例 
如 :一 个 sum 是 一 个 产物 ， 接 下 来 被 0 跟随 ， 或 更 多 的 组 ， 每 个 由 额外 的 操作 符 和 另外 的 产 
物 组 成 ， 一 个 语义 规则 如 下 : 


sum : product {+|- product)... 


被 翻译 成 C 函 数 如 下 : 
static void “ sum (void) 
{ 
void * result = product(); 
const void * type; 

for (;;) 

{ switch (token) { 
case 
case: 

scan(0), product () continue: 
return: 

} 

} 


对 于 每 一 个 语义 规则 有 一 个 C 函 数 ， 以 便于 这 些 规则 能 够 相互 调用 ， 这 些 不 同 的 分 支 被 转换 
成 switch 或 if 语句 ， 和 迭代 的 语法 将 在 C 中 翻译 成 循环 。 仅 仅 一 个 问题 就 是 我 们 必须 避免 
无 限 的 递归 。 


token 总 是 包含 下 一 个 输入 的 符号 。 如 果 我 们 识别 出 它 ， 我 们 必须 调用 scan(o) 


3.4 DES 


我 们 如 何 来 处 理 表 达 式 呢 ? 如 果 我 们 仅仅 想 用 一 些 用 数字 表示 的 值 执行 简单 的 算术 。 我 们 可 
以 扩展 识别 函数 并 且 一 旦 识别 出 操作 符 和 操作 码 就 计算 出 结果 如 : smo 应 该 会 期 望 从 每 一 
个 对 product() 的 调用 期 望 一 个 double 类 型 的 结果 ， 尽 可 能 的 执行 加 或 减法 ， 并 且 返 回 结 
果 ， 再 次 作为 一 个 double 类 型 函数 的 值 。 


如 果 我 们 想 要 建立 一 个 系统 用 来 处 理 更 加 复杂 的 表达 式 ， 我 们 需要 存储 表达 式 以 便于 后 续 处 
理 。 在 这 种 情况 下 ， 我 们 能 够 不 仅仅 执行 算术 ， 而 且 可 以 允许 决定 并 且 有 条 件 的 评估 一 个 表 
达 式 的 一 部 分 ， 且 可 用 存储 的 表达 式 作 为 用 户 的 函数 包含 在 其 他 表达 式 中 。 我 们 所 需要 的 是 
一 个 合理 通用 的 方式 代表 一 个 表达 式 。 上 比较 常规 的 技术 是 使 用 一 个 二 又 树 在 每 一 个 节点 上 存 


储 token. 


struct Node { 
enum tokens token, 
struct Node * left, * right; 


}; 


然而 ， 这 样 并 不 是 很 灵活 。 我 们 需要 介绍 一 个 union 去 创建 一 个 节点 ， 在 这 个 节点 上 我 们 可 
存储 一 个 数 ， 并 且 我 们 在 这 些 节点 代表 的 一 元 操作 符 上 浪费 了 空间 。 We ， process() 和 
delete() 将 包含 witch 分 支 ， 并 witch 分 支 会 随 着 我 们 增加 的 符号 而 增多 。 


3.5 信息 隐藏 


应 用 迄今 为 止 我 们 学 到 的 ， 我 们 绝 不 去 揭示 节点 结构 。 相 反 ， 我 们 先 在 头 文件 value.h PAL 
置 一 些 声明 如 下 


const void * Add; 
vordi = new (Const vord = type, i) 


void process (const void “ tree): 
vordidetete vol aeey 


现在 我 们 可 以 编写 代码 sum) 如 下 : 


#include "value.h" 
static void * sum (void) 


{ 
void * result = product(); 
const void * type; 
for (;;) 
{ 
switch (token) { 
case To: 
type = Add; 
break; 
case 1-1: 
type = Sub; 
break; 
default: 
return result; 
scan(0); 
result = new(type, result, product()); 
3 
} 


product() 与 sum) 有 相同 的 结构 ， 并 且 调 用 一 个 函数 factor) 去 识别 数字 ， 符 号 ， 
E sum 被 赋予 了 括号 : 


static void = factor (void) 
{ 
void * result; 
switch (token) { 
Case 
scan(0): 
return factor(): 
case hen: 
scan(0); 
return new(Minus, factor()); 
default: 
error(''bad factor: 'Xc' 0x%x", token, token): 
case NUMBER: 
result = neuv(Value, number): 
break; 
case '(': 
scan(0): 
result = sum(); 
if (token != ')') 
error( "expecting )"); 
scan(0); 
return result; 
} 
尤其 在 factor() 中 ， 我 们 需要 特别 小 心 的 保持 扫描 器 (scanner) 是 不 变 的 : token 必须 
总 是 包含 下 一 个 输入 的 符号 。 一 旦 token 被 使 用 ， 我 们 需要 调用 scan(o) 。 
3.6 动态 连接 
识别 器 是 完善 的 。 value.h 对 于 和 工 术 表达 式 完 全 隐藏 了 求 值 程序 ， 且 与 此 同时 指定 了 我 们 必 
须 所 实现 的 。 new() 携带 描述 符 ， 如 Add 和 合适 的 参数 如 指针 对 加 的 操作 且 返 回 一 个 表示 
和 的 指针 。 
struct Type { 


}; 


VOTA 


void * (* new) (va list ap): 
double (* exec) (const void * tree): 
void (* delete) (void * tree): 


new (Const void = type, ...) 


va list ap; 


pë 动态 连接 并 传递 一 个 对 指定 节点 例 程 的 调用 ， 在 例 程 中 的 add 


void * result; 


assert(type && ((struct Type “) type) -> new); 


va start(ap, type): 

result = ((struct Type *) type) -> new(ap); 
* (const struct Type **) result = type; 

va end(ap): 

return result; 


， 并且 传 进 两 个 指针 。 


分 支 处 ， 必 须 常见 一 


truct Bin { 
const void * type: 
void “ left, ~“ right; 
}; 


static void * mkBin (va list ap) 
struct Bin “ node = malloc(sizeof(struct Bin)): 


assert(node): 
node -> left = va arg(ap, void *); 
node -> right = va arg(ap, void *); 
return node; 


注意 ， 只 有 mkBin() 知道 它 创 建 的 是 什么 。 所 有 我 们 要 求 的 是 各 个 节点 对 于 动态 连接 是 以 一 
个 指针 开始 。 这 个 指针 被 new 传 进 一 遍 于 delete() 能 够 调用 到 它 指定 节点 的 函数 : 


void delete (void * tree) 
{ 


assert(tree && * (struct Type **) tree 
88 (* (struct Type **) tree) -> delete): 


(* (struct Type **) tree) -> delete(tree): 


动态 连接 很 优雅 的 避免 了 复杂 难 解 的 节点 。 ,new() 精确 的 创建 了 每 个 类 型 描述 符 的 右 节 点 : 
二 元 操作 符 拥 有 两 个 子孙 。 一 元 操作 符 拥 有 一 个 子孙 ， 且 值 节点 仅仅 包含 了 值 。 delete() 是 
一 个 非常 简单 的 函数 因为 每 个 节点 处 理 它 自己 的 销毁 过 程 : 二 元 操作 符 删 除 两 个 子 树 并 且 释 
放 他 们 自己 的 节点 ， 一 元 操作 符 仅 仅 删 除 一 个 子 树 ， 且 值 节点 仅仅 释放 自己 。 变 量 和 常量 其 
至 可 以 留 到 后 面 对 于 delete() 的 回应 他 们 简单 的 什么 也 不 做 。 





3.7 A Postfix Writer 


到 目前 为 止 我 们 还 没有 费 正 的 决定 process) 将 要 站 正 做 什么 。 如 果 我 们 想 要 发 布 一 个 表达 
式 的 后 组 版， 我 们 将 要 对 struct Type 增加 一 个 字符 串 以 便于 显示 出 实际 的 操作 符 ， 且 
process() 将 要 安排 一 个 单独 的 被 tab 键 缩 进 的 行 : 


void process (const void * tree) 


{ 
putchar('7t')5 
exec(tree, (* (struct Type **) tree) -> rank, 0); 
putchar('7n'):5 

} 


exec() 处 理 动 态 连 接 


static void exec (const void * tree, int rank, 


{ 


assert(tree && * (struct Type **) tree 


int par) 


&& (* (struct Type **) tree) -> exec); 


(* (struct Type **) tree) -> exec(tree, 


每 一 个 二 元 操作 符 被 使 用 如 下 元 数 发 出 : 


static void doBin(const void *tree) 

{ 
exec(((struct Bin *) tree) — left); 
exec(((struct Bin *) tree) — right): 
oë ASi 


w 


类 型 描述 符 如 下 绑 定 : 


{ mgt 
{ “u 


static struct Type Add 
static struct Type Sub 
const void * Add = 8 Add: 
const void * Sub = 8 Sub: 


应 该 很 容 多 猜测 一 个 数值 是 怎样 被 实现 的 。 它 被 代表 作为 一 个 结构 体 携带 double 


struct Val { 
const void * type; 
double value; 


mkBin, doBin, 
mkBin, doBin, 


rank, par); 


(* (struct Type **) tree) — name); 


freeBin }; 
freeBin }; 


}; 

static void * mkval (va list ap) 

{ 
struct Val * node = malloc(sizeof(struct Val)); 
assert(node); 
node — value = va arg(ap, double): 
return node; 

} 

处 理 组 成 的 打印 值 : 


static void doval (const void ~ tree) 


printf(" %g", 


我 们 已 经 做 了 





static struct Type Value = { "", 
const void * Value = & _Value; 


一 元 操作 符 如 minus 将 留 作 练习 。 


没有 子 树 要 删除 ， 因 此 我 们 可 以 使 用 库 函 数 free() 


((struct Val *) tree) — value): 


直接 的 删除 值 节点 : 


mkval, doval, free }; 


3.8 算术 


如 果 我 们 想 做 算术 运算 ， 我 们 让 执行 的 函数 返回 一 个 double 类 型 的 值 ， 然 后 让 process() 
打印 这 个 值 : 


static double exec (const void “ tree) 


{ 
return (* (struct Type **) tree) — exec(tree); 
} 
void process (const void “ tree) 
t 


printf('Ztëgjn', exec(tree)): 


对 于 每 个 节点 的 类 型 ， 我 们 需要 一 个 执行 函数 来 计算 和 返回 这 个 节点 的 值 。 这 里 有 两 个 实 
例 : 


static double doval (const void “ tree) 
return ((struct Val “) tree) — value: 


static double doAdd (const void “ tree) 


{ 


return exec(((struct Bin *) tree) — left) + 
exec(((struct Bin *) tree) — right): 


static struct Type Add = { mkBin, doAdd, freeBin }; 
static struct Type Value = { mkVal, doval, free }; 
const void * Add = 8 Add: 

const void * Value = 8 Value: 


3.9 插入 输出 


也 许 对 于 处 理 算术 表达 式 的 突出 点 是 带 小 括号 的 形式 打印 。 这 通常 是 有 点 滑稽 的 ， 依 照 谁 来 
负责 发 出 括号 。 此 外 对 于 操作 符 的 名 字 用 于 前 缓 输出 ， 我 们 增加 了 两 个 数值 
到 struct Type 中 。 


struct Type { 
const char * name; /* node”'s name */ 
char rank, rpar; 
void * (* new) (va_list ap); 
void (* exec) (const void * tree, int rank, int par); 
void (* delete) (void * tree); 


di 


.rank 是 优先 的 操作 符 ， 以 1 开始 ， 此 外 .rpar 被 设置 用 于 操作 符 ， 如 减 操作 ， 此 操作 如 果 
用 于 相等 的 优先 级 的 操作 就 要 求 他 们 的 右 操作 被 附 上 括号 。 


$ infix 
(2 3) 
e 23 
1 3) 
EOR) 


这 个 证 实 了 我 们 需要 如 下 的 初始 化 : 


{"+", 1, 0, mkBin, doBin, freeBin}; 
{"—", 1, 1, mkBin, doBin, freeBin}; 


static struct Type Add 
static struct Type Sub 


滑稽 的 部 分 是 对 于 二 元 节点 得 去 决定 它 是 否 必 须要 增加 括号 。 一 个 二 元 节点 如 加 法 ， 被 给 予 
它 自己 较 高 的 优先 级 并 且 一 个 标记 指示 在 相等 的 优先 级 中 括号 是 否 是 必须 的 。 doBin() 去 判 
别 是 否 使 用 括号 : 


static void doBin (const void “ tree, int rank, int par) 


{ 
const struct Type * type = * (struct Type **) tree; 
par = type —> rank < rank 
|| (par 88 type -> rank == rank); 
if (par) 
putchar(”(”): 
exec(((struct Bin “) tree) — left, type — rank, 0); 
printf(" %s ', type — name): 
exec(((struct Bin “) tree) — right, 
type — rank, type — rpar); 
if (par) 
putchar(')”'): 
} 


与 高 优先 级 的 操作 符 比 若 我 们 有 一 个 较 低 优先 级 ， 或 者 如 果 我 们 被 要 求 在 相等 的 优先 级 情况 
下 输出 括号 ， 我 们 就 打印 括号 。 在 任何 情况 下 ， 如 果 我 们 的 描述 有 .rpar 的 设置 ， 我 们 要 求 
仅仅 我 们 的 所 有 操作 输出 额外 的 括号 如 上 : 


保持 打印 的 实例 程序 是 较 容 易 写 的 。 
3.10 总 结 
三 种 不 同 的 处 理 器 证 实 了 信息 隐藏 的 优越 性 。 动 态 连 接 帮 助 我 们 把 一 个 问题 分 解 成 很 简单 的 


函 数 功 能 点 。 最 终 的 程序 是 很 容易 扩展 的 试 着 去 增加 C 语 言 中 的 比较 和 如 ?: 的 操作 符 
“E, o 








代码 重用 和 改进 


来 源 : http://blog.csdn.net/besidemyself/article/details/6423491 


第 四 章 继承 


译 者 : besidemyself 


4.1 一 个 超级 类 一 一 点 


我 们 将 在 这 章 以 一 个 基本 的 画图 程序 作为 开始 。 这 里 是 是 我 们 乐意 拥有 的 其 中 一 个 类 的 快速 
测试 如 下 : 

tinclude "Point.h" 

tinclude "new.h" 


int main (int argc, char == argv) 


{ 
void “ pj 
vhile (* tt argv) 
switch (** argv) 1 
case pi: 
p = nen(Point, 1, 2); 
break; 
default: 
continue; 
} 
draw(p); 
move(p, 10, 20); 
draw(p); 
delete(p); 
return 07; 
} 


对 于 每 一 个 命令 参数 以 字符 p 开始 ， 我 们 获得 一 个 新 的 绘图 的 点 ， 移 动 这 个 点 到 某 处 ， 从 新 
绘制 ， 并 且 删 除 。 标 准 化 C 语 言 不 包含 图 形 化 输出 标准 的 函数 : 然而 ， 如 果 我 们 坚持 产生 一 幅 
图 片 ， 我 们 能 够 发 表 文 本 ， 对 于 这 个 文本 Kernighan 的 图 片 [Ker82] 能 够 理解 : 


$ points p 
UU A 
vat 11,22 


坐标 对 于 测试 是 无 关 紧 要 的 一 一 从 商业 和 面向 对 象 的 说 法 解释 :“ 点 就 是 一 则 消息 。” 


我 们 用 这 个 点 能 做 些 什 么 呢 ? new() 将 产生 一 个 点 ， 并 且 构 造 器 期 望 着 初始 化 坐标 作为 进 一 
步 的 参数 传 进 new() JËTË 7 delete() 将 回收 我 们 的 点 并 且 按 照 惯例 调用 析 构 器 。 





draw() 安排 点 被 显示 出 来 。 由 于 我 们 希望 与 其 他 图 形 对 象 协同 工作 因此 在 测试 程序 中 会 


对 于 draw() 我 们 将 提供 动态 连接 。 





有 Switch 


move() 通过 传递 一 系列 参数 来 改变 点 的 坐标 。 如 果 我 们 实现 每 一 个 图 形 对 象 ， 这 些 对 象 都 与 
它 涉及 的 点 关联 ， 我 们 将 能 够 通过 简单 的 应 用 这 个 点 的 move() 方法 来 移动 它 。 因 此 ， 对 
于 move() 在 不 需要 动态 连接 的 情况 下 我 们 应 该 可 以 做 。 


4.2 超级 类 的 实现 点 


在 Point.h 中 ， 抽 象 数 据 类 型 包含 如 下 : 





extern const void “ Point: nen Bonne yp 


void move (void “ point, int dx, int dy): 


我 们 能 够 重复 利用 第 二 章 的 new 文件 ， 尽 管 我 们 删除 了 很 多 方法 并 且 对 new,h 文件 增加 
了 draw() 方法 : 


vorid = new (Const Vordi = class) 
void delete (void ”“ item): 
void drav (Const void “ self): 


在 new.r 中 类 型 描 述 struct Class 应 该 与 在 new.h 中 声明 的 方法 相关 联 : 


struct Class { 
size_t size; 
void * (* ctor) (void * self, va_list * app); 
void * (* dtor) (void ”“ self): 
void (* draw) (const void * self); 


}; 


选择 器 draw() 在 new.c 中 实现 。 它 将 代替 如 differ) 在 2.3 节 介 绍 的 选择 器 ， 并 且 以 相同 
的 风格 编写 代码 : 


void draw (const void “ self) 


{ 
const struct Class * const * cp = self: 
assert(self && * cp && (* cp) -> draw); 
(* cp) -> draw(self); 
} 


这 些 预备 工作 完成 后 ， 我 们 将 转 去 做 真正 的 工作 去 写 point.c ， 对 点 的 实现 。 在 此 ， 面 向 对 
象 帮助 我 们 精确 的 鉴别 出 我 们 需要 做 什么 : 我 们 必须 对 表示 式 做 出 决定 并 实现 构造 器 ， 析 构 
器 ， 动 态 链接 方法 draw() 和 静态 链接 方法 move() ， 这 些 都 是 基本 的 函数 。 如 果 我 们 坚持 二 
维 ， 箭 卡尔 坐标 ， 我 们 选择 如 下 明确 的 表示 : 


struct Point { 
const void “ class: 
ae NJË /* coordinates “7 


di 


构造 器 必须 初始 化 坐标 .x 和 y 一 现在 一 个 绝对 的 例 程 如 下 : 


Static Vordi > ROInmtSctEOn (Void mser va st app) 


{ 
struct Point * self = _self; 
self -> x = va_arg(* app, int); 
self -> y = va_arg(* app, int); 
return self; 
} 


现在 的 结果 是 我 们 并 不 需要 析 构 器 ， 因 为 在 delete() 之 前 没有 资源 需要 回收 。 
在 Point_draw() 函数 中 ， 我 们 以 一 种 图 片 能 够 识别 的 方式 打印 当前 的 坐标 : 


static void Point dravm (Const void “ self) 
{ 


const struct Point * self = _self; 


DanmEENN atc %QURXOUNITE self ->x self >y); 


这 样 照 顾 到 所 有 的 动态 连接 方法 ， 并 且 我 们 能 够 定义 类 型 描述 符 ， 在 此 一 个 空 的 指针 代表 一 
个 不 存在 的 析 构 器 : 


static const struct Class Point = £ 
sizeof(struct Point), Point ctor, 0, Point dranvn 


}; 


const void * Point = & Point, 


move() 不 是 动态 连接 的 ， 因 此 我 们 省 略 static 使 得 它 作 用 域 能 够 超出 point.c 并 且 我 们 不 


给 它 加 类 名 前 级 Point 


void move (void “ self, int dx, int dy) 


t 


struct Point “ self = self, 


self -> x += dx, self -> y += dy; 
与 在 new.c 中 的 动态 连接 相 结合 ， 这 就 得 出 了 point.c 中 点 的 实现 。 


4.3 继承 一 一 环 
一 个 环形 仅仅 是 一 个 大 的 点 : 此 外 对 于 中 心 坐 标 它 需要 一 个 半径 。 画 法 有 点 不 同 ， 但 是 移动 
只 需要 我 们 改变 中 心 坐 标 。 


这 就 是 我 们 能 够 正常 的 为 我 们 的 文本 编辑 器 和 演 择 源 代码 重用 而 做 好 准备 的 地 方 。 我 们 对 点 
的 实现 做 一 个 拷贝 并 且 改 变 环 与 点 不 同 的 地 方 。 struct circle 获取 其 他 额外 的 组 成 : 


int rad; 


这 部 分 组 成 在 构造 器 中 初始 化 


self->rad=va_arg(*app, int); 


并 且 在 Circle_draw() 中 使 用 : 


printf(''circile at xd sdi rad Nn 
self — x, self — y, self — rad), 


我 们 在 move() 中 有 点 迷惑 。 对 于 一 个 点 和 一 个 环 必 要 的 动作 是 相同 的 : 对 于 坐标 部 分 我 们 需 
要 增加 转移 参数 。 然 而 ， 在 一 种 情况 ” move() 工作 于 struct Point 2 EKA 外 一 种 情况 “E 
工作 与 struct Circle 。 如 果 move() 是 动态 连接 的 ， 我 们 需要 提供 两 个 不 同 的 函数 去 做 相同 
的 事情 。 但 是 ， 会 有 更 好 的 方式 ， 考 虑 一 下 点 和 环 表示 的 层 : 


struct Point struct Circle 


图 片 显示 每 一 个 环 都 以 一 个 点 开始 。 如 果 我 们 分 配 一 个 struct circle 通过 增加 

到 struct Point 的 结尾 ， 我 们 可 以 向 move) 函数 中 传递 一 个 环 ， 因 为 表示 式 的 初始 化 部 分 
看 起 来 仅仅 像 点 ， 而 move() 方法 期 望 接 到 收 点 ， 并 且 点 仅仅 是 move() 方法 能 够 改变 的 。 这 
里 是 一 个 合理 的 方式 确保 对 环 的 初始 化 部 分 总 看 起 来 像 点 : 


Struct Circle f const struct Point ., int rad; y; 


我 们 让 派生 的 结构 体 以 一 个 我 们 要 扩展 的 基 结构 体 的 措 贝 而 开始 。 信 息 隐藏 要 求 我 们 决 不 直 
接 的 访问 基 结 构 体 ; 因此 ， 我 们 使 用 几乎 不 可 见 的 下 划 线 作为 它 的 名 字 并 且 把 它 声明 
为 const 避 开 粗心 的 指派 。 


这 就 是 简单 的 继承 的 全 部 : 一 个 子 类 从 一 个 超 类 (或 者 基 类 ) 继承 仅仅 通过 扩充 表示 超 类 的 
结构 体 。 


由 于 子 类 对 象 (一 个 环 ) 的 表示 就 像 一 个 超 类 对 象 (一 个 点 ) 的 表示 一 样 动身 。 环 总 能 够 伴 
装 成 一 个 点 一 在 一 个 环 的 表示 的 初始 化 地 址 处 的 确 是 一 个 点 的 表示 。 





向 move() 中 传递 一 个 环 是 完全 确定 的 : 子 类 继承 了 超 类 的 方法 ， 因 为 这 些 方法 仅 在 子 类 的 表 
示 上 操作 ， 这 些 子 类 的 表示 和 超 类 的 表示 是 相同 的 ， 而 这 些 方法 原先 就 在 超 类 上 号 好 了 。 传 

递 一 个 环 就 像 传 递 一 个 点 意味 着 把 struct Circle” 转换 成 struct Point” 。 我 们 将 把 这 样 的 

操作 看 成 一 个 从 子 类 到 超 类 的 上 抛 一 在 标准 化 C 语 言 中 ， 它 能 够 使 用 明确 的 转换 操作 符 来 实 
现 或 者 通过 中 间 的 void” 的 值 。 


常 是 不 佳 的 ， 然而， 传递 一 个 点 到 一 个 函数 专 为 环 如 ， circle _draw() : 如 果 一 个 点 原先 
就 是 一 个 环 ， 从 struct Point” 转换 成 struct circle* 仅仅 是 可 允许 的 。 我 们 称 这 样 的 从 起 
类 到 子 类 的 转换 为 下 抛 一 这 也 要 求 明 确 的 转换 或 void* 值 ， 并 且 它 仅仅 对 于 指针 ， 对 于 对 象 
能 够 使 用 ， 指 针 ， 对 象 在 子 类 的 开始 做 转换 。 


对 于 动态 连接 方法 如 draw() ， 这 种 情形 是 不 同 的 。 让 我 们 再 次 看 先前 的 图 片 ， 这 次 完全 明确 
类 型 描述 符 如 下 : 


连接 和 继承 


move() 不 是 动态 太 连 连接 的 并 且 不 使 用 动态 态 连 连接 方法 做 工作 然而 我 们 月 芭 够 传递 一 个 指针 和 环 
到 move() 中 ， 它 的 确 不 是 一 个 多 肽 的 函数 : move() 对 于 不 同 的 对 象 不 会 做 不 同 的 处 理 ， 它 
总 是 增加 参数 到 坐标 ， 忽 略 其 他 与 坐标 相依 附 的 。 


当 我 们 上 抛 从 一 个 环 到 一 个 点 时 ， 我 们 没有 改变 环 的 状态 ， 换 和 句 话说 ， 即 使 我 们 把 环 

的 struct Circle 表示 当成 一 个 点 的 struct Point ， 我 们 不 会 改变 它 的 内 容 。 结 果 ， 把 环视 

为 点 作为 一 个 类 型 描述 符 仍然 拥有 circle ， 因 为 点 在 它 的 .class 部 分 并 没有 改 

变 。 draw() mm Ro Po AK AMË PA FA 16 të AKT A TË 9 KATE AI TY 7 Kah 
class 所 指示 的 类 型 描述 符 ， 并 且 调 用 在 这 里 存储 的 画图 方法 。 


一 个 子 类 继承 它 的 超 类 的 静态 链接 的 方法 _ 这些 方法 操作 子 类 对 象 的 部 分 ， 这 些 子 类 对 和 象 
是 已 经 在 超 类 对 象 上 呈现 的 。 一 个 子 类 能 够 选择 支持 它 自己 的 方法 代替 它 的 超 类 的 动态 连接 
方法 。 如 果 继承 ， 即 ， 若 没有 重 写 ， 超 类 动态 的 连接 的 方法 就 像 静 态 连接 的 方法 一 样 的 起 作 
E ， 子 类 他 自己 的 动态 连接 方法 的 版 本 访问 
子 类 对 象 所 有 的 表示 ， 即 ， 对 于 一 个 环 ， draw() 将 会 调用 circle dran) 方法 ， 此 方法 能 够 
考虑 到 半径 当 画 环 的 时 候 。 





4.5 静态 和 动态 连接 


一 个 子 类 继承 了 它 的 超 类 的 静态 链接 的 方法 并 且 选 择 性 的 继承 或 重 写 动态 连接 的 方法 。 考 处 
对 于 move() 和 draw() 的 声明 如 下 : 


void move(voidr point, int dx,int dy): 
void dran(const void” self): 


我 们 不 能 够 从 这 两 个 声明 中 发 现 连接 ， 尽 管 对 于 move() 的 实现 能 够 直接 的 工作 ， 然 

而 draw() 仅仅 是 一 个 选择 器 函数 在 运行 时 跟踪 动态 连接 。 不 同 点 就 是 我 们 声明 一 个 静态 链接 
方法 就 像 move() 在 Point.h 中 作为 抽象 数据 类 型 接口 的 一 部 分 ， 且 我 们 声明 一 个 动态 连接 
方法 就 像 draw() 携带 内 存 管理 接口 在 new.h 中 ， 因 为 迄今 为 止 我 们 已 经 决定 在 new.c 中 实 
现 数据 选择 器 。 


静态 链接 会 更 加 有 效率 因为 C 编 译 器 能 够 使 用 直接 的 地 址 调用 子 程序 ， 但 是 对 于 一 个 函数 
如 全 了 类 不 能 被 重生 o 动态 连接 在 间接 调用 的 扩展 上 更 加 便捷 一 一 我 们 已 经 对 调用 

选择 器 函数 如 draw() 的 额外 开销 作 了 决定 ， 检 查 参数 ， 定 位 ， 调 用 正确 的 方法 。 我 们 丢弃 了 
检查 并 且 使 用 macro* 像 如 下 减少 了 额外 开销 : 


#define draw(self) ((*(struct Class**)self)->draw(self)); 


但 是 如 果 他 们 的 参数 有 负面 的 影响 宏 会 引发 问题 并 且 对 于 宏 并 没有 明确 的 技术 用 于 操作 可 变 
参数 列表 。 此 外 ， 宏 需要 struct Class 的 声明 ， 此 struct Class 到 目前 为 止 对 于 类 的 实现 
已 经 可 用 而 不 是 对 于 整个 程序 。 


不 幸 的 是 当 我 们 设计 超 类 时 ， 我 们 还 需要 决定 很 多 事情 。 但 是 函数 调用 方法 是 不 会 改变 的 ， 
它 会 占用 很 多 文本 编辑 ， 更 可 能 的 会 在 许多 类 中 ， 把 一 个 函数 的 定义 从 静态 转换 到 动态 连 
接 ， 反 之 亦 然 。 从 第 七 章 开 始 我 们 将 使 用 一 个 简单 的 预 处理 去 简化 编码 ， 即 使 如 此 连接 转换 
也 是 极 易 出 错 的 。 


带 着 这 种 怀疑 ， 与 静态 链接 相 比 决定 动态 连接 可 能 会 更 好 点 即使 它 效率 较 低 。 通 用 函数 能 提 
供 一 个 有 用 的 概念 性 的 抽象 并 且 他 们 倾向 于 减少 我 们 需要 在 项 目 过 程 中 记忆 的 函数 名 的 数 
量 。 如 果 ， 实 现 所 有 要 求 的 类 后 ， 我 们 发 现 其 实 动态 连接 方法 从 来 没有 被 重 写 ， 通 过 其 单一 
的 实现 去 替代 它 的 选择 器 并 且 甚 至 在 struct Class 中 浪费 它 的 位 置 与 扩展 类 型 描述 和 更 正 所 
有 的 初始 化 相 比 麻烦 会 更 少 。 


4.6 可 见 度 和 访问 函数 


我 们 现在 可 以 尝试 着 实现 circle_draw() 。 基 于 “need to know "这 样 的 规则 信息 隐藏 要 求 我 们 
对 于 每 个 类 使 用 3 个 文件 。 circle.h 包含 抽象 数据 类 型 接口 ; 对 于 一 个 子 类 它 包含 了 超 类 的 
接口 文件 以 便于 这 样 的 声明 使 得 继承 的 方法 可 用 : 


tinclude "Point.h" 
extern const void” Circle; Z'nen(Circle,x,y,rad)”7 


接口 文件 circle.h 被 应 用 程序 代码 所 包含 并 且 对 于 类 的 实现 ; 它 避 免 了 多 次 包含 所 引发 的 错 
误 。 

一 个 环 的 表示 在 第 二 个 头 文件 中 声明 ， circle.r 。 对 于 子 类 它 包 含 了 超 类 的 表示 文件 以 便于 
我 们 能 够 通过 扩展 超 类 派生 出 子 类 的 表示 : 


tinclude "Point.r" 
struct Circlefconst struct Point yint radj): 


9 表示 去 实现 继承 - struct Circle 包含 了 一 个 const struct Point ° 这 个 点 
move() 将 改变 它 的 坐标 但 是 const 限定 词 防止 了 意外 的 覆盖 它 的 
o 表示 文 件 circle.r 仅仅 被 类 的 实现 所 包含 ; 仍然 受到 多 重 调用 的 保护 。 








最 终 ， 对 一 个 环 的 实现 对 于 类 ， 对 于 对 象 管理 ， 被 在 包含 接口 和 表示 文件 的 原文 件 circle.c 
中 所 定义 : 


tinclude "Circle.h" 
tinclude "Circle.r" 
tinclude "new.h" 
tinclude "new.r" 


~ 


static void Circle drav(const void “ self) 


{ 


const struct Circle* self= self; 
printf(''circle at %d rad %d\n",self->_ .x,self-- .y,self-z-rad): 


在 circle dran() 中 ， 对 于 环 我 们 通过 子 类 部 分 使 用 “可见 的 名 字 ”. 来 读 取 点 部 分 。 从 信息 隐 
藏 的 角度 看 这 并 不 是 一 个 好 的 注意 。 然 而 读 取 坐 标 值 不 应 该 产生 重大 的 问题 ， 我 们 决 不 能 确 
保 在 其 他 情形 下 ， 一 个 子 类 的 实现 不 去 直接 的 欺骗 和 修改 它 的 父 类 的 一 部 分 ， 因 此 带 着 其 不 
变量 去 玩 一 场 浩劫 。 


效率 要 求 一 个 子 类 能 直接 的 访问 到 其 超 类 的 组 成 部 分 。 信 息 隐 藏 和 可 维护 性 原则 要 求 一 个 超 
类 从 它 的 子 类 上 尽 可 能 好 的 隐藏 对 它 自 己 的 表示 。 如 果 我 们 后 面 做 出 选择 ， 我 们 应 该 能 够 提 
供 对 这 些 子 类 被 允许 查看 超 类 所 有 组 成 部 分 访问 函数 ， 并 且 对 于 这 些 组 成 部 分 提供 更 正 函 
数 ， 即 ， 便 要 子 类 去 做 修改 。 


访问 和 修改 函数 时 静态 链接 的 方法 。 如 果 我 们 对 于 超 类 在 表示 文件 中 声明 了 他 们 ， 超 类 仅 包 
含 在 子 类 的 实现 中 ， 我 们 可 以 使 用 宏 ， 如 果 宏 使 用 每 个 参数 仅 以 此 则 副作用 没有 问题 。 作 为 
一 个 例子 ， 在 point.r 中 ， 我 们 定义 了 下 面 的 访问 宏 : 


#define x(p) (((const struct Point*)(p))->x) 
tdefine y(p) (((const struct Point”')(p))--y) 


这 些 宏 对 于 任何 以 struct Point 开始 对 象 能 够 被 应 用 于 一 个 指针 ， 也 就 是 说 ， 对 于 对 象 ， 从 
我 们 的 点 的 任何 子 类 。 这 项 技术 即 为 ， 上 抛 我 们 的 点 到 超 类 并 引用 我 们 感 兴 趣 的 部 
分 。 const 在 抛 得 过 程 中 对 结果 的 分 配 。 如 果 const 被 忽略 


#define x(p) (((struct Point*)(p))->x) 


一 个 宏 调 用 xp) 产生 一 个 能 成 为 分 配 的 目标 的 1-value ， 一 个 好 点 的 修改 函数 最 好 是 一 个 


的 定义 


小 


#define set x(p,v) (((struct Point')(p))-2xz(v)) 


此 定义 产生 一 个 分 配 。 


在 子 类 实现 的 外 部 对 于 访问 和 修改 函数 我 们 仅仅 使 用 静态 链接 的 方法 。 我 们 不 能 够 求助 于 
宏 ， 因 为 对 于 宏 引 用 超 类 的 内 部 表示 是 不 可 见 的 。 对 于 包含 进 应 用 程序 的 信息 隐藏 并 不 提供 
表示 文件 point.r 而 实现 。 


宏 定义 揭示 了 ， 然 而 ， 一 旦 一 个 类 的 表示 可 用 ， 信 息 隐 藏 能 够 被 很 容易 的 击败 。 这 里 有 一 个 
方式 更 好 的 隐藏 struct Point 。 在 超 类 的 实现 中 ， 我 们 使 用 正常 的 定义 : 


struct Point{ 
const void” class; 
INE X, y; 


}; 


对 于 子 类 的 实现 我 们 提供 下 面 的 看 起 来 不 透明 的 版 本 : 


struct Point{ 
const char  (sizeof(struct fconst void” class: int X,y:D)I: 


Ti 


这 个 结构 体 像 先前 拥有 相同 的 大 小 ， 但 是 我 们 不 能 够 读 取 也 不 能 够 写 它 的 组 成 部 分 因为 他 们 
被 隐藏 在 一 个 匿名 的 内 部 结构 中 。 重 点 是 这 两 种 声明 必须 包含 相同 的 组 成 部 分 的 声明 并 且 这 
在 没有 与 处 理 器 的 情况 下 是 很 难 维持 的 。 


4.7 子 类 的 实现 一 一 环 


我 们 已 经 做 好 了 些 完整 实现 的 准备 ， 我 们 可 以 选择 先前 部 分 介绍 的 我 们 最 喜欢 的 技术 。 面 向 
对 象 规 定 我 们 需要 一 个 构造 器 ， 可 能 的 话 还 会 有 一 个 析 构 器 ， circle draw() ， 和 类 型 描 

W circle 都 绑 定 在 一 起 。 以 便于 练习 我 们 的 方法 ， 我 们 包含 了 circle.h 并 增加 了 下 面 的 行 
在 4.1 部 分 的 程序 中 做 测试 : 





case 'c': 
p=new(Circle, 1,2,3); 
break; 


现在 我 们 能 够 观察 到 下 面 的 测试 程序 的 表现 : 


$ circles p c 

U E 

u aa T2 

circle at 1,2 rad 3 
circle at 11,22 rad 3 


环 的 构造 函数 接收 3 个 参数 : 第 一 个 参数 为 环 的 点 的 坐标 接 下 来 是 半径 。 初 始 化 点 部 分 是 点 的 
构造 器 的 工作 。 它 会 处 理 部 分 new() 参数 列表 的 参数 。 环 的 构造 器 从 它 的 初始 化 半径 的 地 方 
携带 保留 的 参数 列表 。 


一 个 子 类 的 构造 器 首先 应 该 允许 超 类 做 部 分 初始 化 ， 这 部 分 初始 化 把 清晰 地 内 存 带 进 超 类 对 
象 。 一 旦 超 类 构造 器 构造 完成 ， 子 类 构造 器 完成 初始 化 并 把 超 类 对 象 带 进 子 类 对 象 中 。 


对 于 环 ， 意 味 着 我 们 需要 调用 point ctor() 。 像 其 他 所 有 动态 链接 一 样 ， 这 个 函数 被 声明 
为 static ， 因 此 隐藏 在 Point.c 的 内 部 。 然 而 ， 我 们 仍然 能 够 通过 在 circle.c 中 可 用 的 
类 型 描述 符 来 point 获得 此 函数 。 


staticivololcincleseto (Void seli va LISE app) 


{ 
struct Circle * self = 
((const struct Class *) Point) — ctor( self, app): 
self — rad = va arg(” app, int); 
return self; 
} 


这 里 应 该 很 清楚 为 什么 我 们 传递 参数 的 地 址 app 列表 指针 到 每 个 构造 器 而 不 是 va list 的 值 
本 身 : new() 调用 子 类 的 构造 器 ， 此 构造 器 调用 超 类 的 构造 器 ， 等 等 。 最 超级 的 构造 器 是 第 

一 个 将 去 实际 的 作 一 些 事情 ， 并且 会 捡 起 传 进 new() 的 最 左边 的 参数 列表 。 保 留 的 参数 对 于 
下 一 个 子 类 是 可 用 的 ， 等 等 知道 最 后 ， 最 右边 的 参数 被 最 终 的 子 类 所 使 用 ， 也 就 是 说 ， 

被 new() 所 直接 的 调用 的 构造 器 所 调用 E 


构造 器 以 严格 的 相反 的 次 序 是 最 好 的 组 织 : delete() 调用 子 类 的 析 构 器 。 它 首先 应 该 销毁 它 
自己 的 资源 接 下 来 调用 直接 的 超 类 的 析 构 器 ， 这 个 析 构 器 可 直接 的 销毁 下 一 个 资源 集 等 等 。 
构造 是 先 发 生 在 子 类 之 前 的 父 类 上 的 。 析 构 则 是 相反 ， 子 类 要 先 于 父 类 ， 即 ， 环 部 分 要 先 于 
点 部 分 。 这 里 ， 然 而 ， 什 么 也 不 需要 做 。 


我 们 先前 已 经 让 circle_draw() 工作 了 ， 我 们 使 用 可 见 部 分 ， 并 且 编 码 表示 文件 point.r 如 
T'A 


struct Point { 

const void “ class: 

TNX /coordinatese 
Hi 
#define x(p) (((const struct Point “)(p)) -> x) 
tdefine y(p) (((const struct Point “)(p)) -> y) 


现在 我 们 可 以 对 于 circle draw() 使 用 访问 宏 : 


static void Circle dram (CONSE void “ self) 


t 


const struct Circle * self = self, 
printf("circle at %d,%d rad %d\n",x(self), y(self), self —> rad); 


move() 拥有 静态 链接 并 且 被 从 点 的 实现 上 继承 。 我 们 得 出 结论 环 的 实现 是 通过 定义 仅仅 全 局 
可 见 circle.c 的 部 分 内 容 : 


static const struct Class Circle = { 
sizeof(struct Circle), Circle_ctor, ©, Circle_draw 
J; 


const void “ Circle z— Circle; 


然而 ， 在 接口 ， 表 示 式 ， 实 现 文件 之 间 似 乎 我 们 有 一 个 可 行 的 分 配 程序 文本 实现 类 的 策略 ， 
点 和 环 的 例子 还 没有 显现 出 一 个 问题 : 如 果 一 个 动态 连接 的 方法 如 point_draw() 在 子 类 中 没 
有 被 重 写 ， 子 类 的 类 型 描述 符 需要 指向 在 父 类 实现 的 函数 。 函 数 名 ， 然 而 在 这 里 被 定义 

成 static ， 因 此 选择 器 是 不 能 够 被 规避 的 。 我 们 将 在 第 六 章 看 到 一 个 清晰 地 解决 此 问题 的 方 
法 。 作 为 暂时 的 权衡 ， 我 们 在 这 种 情况 下 可 以 避免 对 static 的 使 用 ， 仅 仅 在 子 类 的 实现 文件 
中 声明 函数 的 头 ， 对 于 子 类 并 且 使 用 函数 名 去 初始 化 类 型 描述 。 


4.8 Së 


超 类 的 对 象 和 子 类 是 相似 的 ， 但 是 在 表现 形式 上 并 不 相同 。 子 类 正常 情况 下 会 有 更 详尽 的 陈 
述 更 多 的 方法 一 一 他 们 被 超 类 对 象 的 版 本 专用 指定 。 





我 们 使 用 超 类 对 象 的 表示 的 找 贝 来 作为 子 类 对 象 表示 的 开始 ， 即 ， 子 类 对 象 通过 把 它 的 组 成 
部 分 增加 到 超 类 对 象 的 末尾 被 表示 。 


一 个 子 类 继承 了 超 类 的 方法 : 因为 一 个 子 类 对 象 的 起 始 部 分 看 起 来 像 超 类 对 象 ， 我 们 可 以 上 
抛 并且 看 到 一 个 指向 子 类 对 象 的 指针 作为 一 个 指向 我 们 能 够 传递 超 类 方法 的 超 类 对 象 。 为 了 
避免 显 性 转换 ， 我 们 使 用 void* 作为 通用 指针 来 声明 所 有 方法 的 参数 。 


继承 可 以 被 看 成 一 个 多 态 机 制 的 根本 形式 : 一 个 超 类 方法 接受 不 同类 型 ， 它 自己 的 类 和 所 有 
子 类 命名 的 对 象 。 然 而 因为 对 象 都 伴 装 成 超 类 对 象 ， 方 法 仅仅 在 每 个 对 象 的 超 类 部 分 起 作 
用 ， 并 且 它 将 ， 因 此 从 不 同 的 类 对 于 对 象 不 会 起 不 同 的 作用 。 


动态 链接 方法 能 够 从 一 个 超 类 继承 或 在 子 类 中 重 写 对 于 子 类 通过 无 论 何 种 函数 的 指针 被 
放 进 类 型 描述 符 来 决定 。 因 此 ， 对 于 一 个 对 象 如 果 动 态 链接 方法 被 调用 ， 我 们 总 能 够 访问 属 
于 对 象 巾 正 的 类 的 方法 即使 指针 上 抛 到 一 些 超 类 上 。 如 果 动 态 链接 方法 被 继承 ， 它 只 能 在 子 
类 对 象 的 超 类 部 分 起 作用 ， 因 为 它 的 确 不 知道 子 类 的 存在 。 如 果 一 个 方法 被 重 写 ， 子 类 的 版 
本 能 够 访问 整个 对 象 ， 他 其 至 可 以 通过 显 性 的 超 类 的 类 型 描述 符 的 使 用 来 调用 它 关 联 的 超 类 
的 所 有 方法 。 





特别 注意 ， 对 于 超 类 的 表示 ， 构 造 器 首先 回调 超 类 的 构造 器 直到 最 终 的 祖先 以 便于 每 个 子 类 
的 构造 器 仅仅 处 理 它 自己 的 对 类 的 扩展 。 每 个 超 类 析 构 器 应 该 先 删 除 它 的 子 类 的 资源 然后 调 
用 超 类 的 析 构 器 等 等 直到 最 终 的 祖先 。 构 造 器 的 调用 顺序 是 从 祖先 到 最 终 的 子 类 ， 析 构 器 的 
发 生 则 正好 是 相反 的 顺序 。 


我 们 的 策略 还 是 有 点 小 毛病 的 : 在 通常 情况 下 我 们 不 应 该 从 一 个 构造 器 中 调用 动态 链接 方 
法 ， 因 为 对 象 也 许 并 没有 完全 被 初始 化 好 。 在 构造 器 被 调用 之 前 new() 把 最 终 的 类 型 描述 符 
插入 到 一 个 对 象 中 ， 作 为 一 个 构造 器 在 相同 的 类 中 是 没有 必要 的 访问 方法 的 。 安 全 的 技术 是 


在 相同 的 类 中 对 于 构造 器 通过 内 部 的 名 字 来 调用 方法 ， 也 就 是 说 ， 对 于 点 ， 我 们 调 
用 Points_draw() 而 不 是 draw() ° 


为 了 鼓励 信息 隐藏 ， 我 们 使 用 了 三 个 文件 对 类 的 实现 。 接 口 文件 包 
述 ， 表 示 文 件 包 含 了 对 象 的 结构 ， 实 现 文 件 包含 了 方法 和 初始 化 类 
文件 包含 了 超 类 接口 文件 并 且 被 实现 和 任何 应 用 所 包含 。 一 个 表示 
件 并 且 仅 仅 被 实现 所 包含 。 


型 描述 的 代码 。 一 个 接口 


含 了 抽象 的 数据 类 型 描 
文件 包含 了 超 类 的 表示 文 


超 类 的 部 分 不 应 该 直接 的 在 子 类 中 被 引用 。 相 反 ， 对 于 每 个 部 分 我 们 能 够 既 提 供 静 态 链接 访 
问 和 尽 可 能 的 修改 方法 ， 也 能 对 于 起 类 的 表示 文件 增加 适当 的 宏 。 函 数 符号 使 得 使 用 文本 纺 
辑 器 或 调试 器 去 跟踪 可 能 的 信息 泄露 或 不 变量 的 破坏 更 简单 。 


4.9 是 或 有 吗 ? 继承 对 集合 


作为 struct circle 我 们 对 环 的 表示 包含 了 对 点 的 表示 : 





struct Circle f const struct Point ., int rad; y; 


但 是 ， 我 们 自然 绝 冬 不 去 直接 的 访问 者 部 分 。 相 反 ， 当 我 们 想 要 继承 我 们 从 circle Fit 
到 point 并 且 在 这 里 处 理 struct Point 的 初始 化 。 


这 里 有 另外 一 个 表示 环 的 方式 : 它 能 包含 一 个 点 作为 一 个 集合 。 我 们 能 够 仅仅 通过 指针 来 处 
理 对 象 ; 因此 这 样 的 一 个 环 的 表示 看 起 来 就 像 如 下 所 示 : 


struct Circle2 { 
struct Point * point; 
int rad; 


}; 


这 个 环 一 点 也 不 像 一 个 点 ， 也 就 是 说 ， 它 不 能 够 从 Point 所 继承 并 且 重 用 它 的 方法 。 然 而 ， 
它 能 够 把 点 的 方法 应 用 到 点 的 部 分 ; 它 仅仅 不 能 把 点 的 方法 用 于 它 自己 。 


如 果 一 种 语言 对 于 继承 有 明确 的 符号 ， 差 异 就 会 更 加 明显 ， 相 似 的 表示 在 C++ 中 会 有 如 下 的 
表示 : 


struct Circle:Pointfint rad;}; ZZinheritance 
struct Circle2( struct Point pointjint rad}; ZZaggregate 


在 C++ 中 作为 一 个 指针 我 们 是 不 必要 访问 对 象 的 。 


继承 ， 即 ， 从 超 类 来 建立 子 类 ， 而 集合 ， 即 ， 把 对 象 的 一 部 分 作为 另外 一 个 对 象 的 一 部 分 ， 
提供 非常 相似 的 功能 。 这 些 应 用 在 特殊 的 设计 中 通常 被 所  is-it-or-has-it ? 的 测试 所 决定 : 如 
果 一 个 新 类 的 一 个 对 象 仅仅 像 一 些 其 他 类 的 对 象 ， 我 们 应 该 使 用 继承 来 实现 新 的 类 ; 如 果 一 
个 新 类 有 一 个 其 他 类 作为 它 的 状态 的 一 部 分 对 象 ， 我 们 应 该 建立 集合 。 


到 我 们 的 点 所 关注 的 ， 一 个 环 仅仅 是 一 个 大 的 点 ， 这 就 是 为 什么 我 们 使 用 继承 来 做 一 个 环 的 
原因 。 一 个 方形 是 一 个 不 明确 的 例子 : 我 们 能 通过 一 个 参考 点 和 边 的 长 度 来 描述 它 ， 或 我 们 
能 够 使 用 端点 的 对 角 线 或 甚至 三 个 角 来 描述 。 仅 仅 带 参考 点 是 方形 的 几 分 花哨 点 ; 其 他 表示 
通 向 集合 。 在 我 们 的 算术 表达 式 中 ， 我 们 已 经 使 用 了 继承 从 单 目 到 双 目 操作 节点 ， 但 是 这 
已 经 充分 的 违背 了 测试 。 


4.10 多 重 继承 


因为 我 们 使 用 平凡 的 标准 化 C 语 言 。 我 们 不 能 够 隐藏 这 样 的 事实 一 “继承 意味 着 在 另 一 个 结构 
的 开始 包含 一 个 结构 体 。 利 用 上 抛 是 在 子 类 的 对 象 上 重复 利用 超 类 方法 的 关键 所 在 。 通 过 投 
掷 一 个 结构 体 起 始 的 地 址 完成 一 个 从 环岛 到 点 的 上 抛 ; 指针 的 值 并 没有 改变 。 





如 果 我 们 在 其 他 结构 中 包含 两 个 及 以 上 的 结构 体 ， 并 且 如 果 我 们 愿意 在 上 抛 期 间 做 一 些 地 址 
点 似乎 是 我 们 不 必 很 仔细 的 设计 继承 的 关系 一 一 我 们 可 以 很 快 的 把 类 仍 到 一 起 并 且 继 承 我 们 
希望 继承 的 任何 东西 。 缺 点 是 ， 显 然 ， 在 我 们 能 够 重用 方法 之 前 我 们 得 有 地 址 处 理 机 制 。 


事情 能 够 实际 的 很 快 让 我 们 感到 迷惑 。 思 考 一 个 文本 ， 一 个 方形 ， 每 一 个 都 有 一 个 继承 的 引 
用 点 。 我 们 能 够 把 他 们 一 起 扔 到 一 个 按钮 上 一 仅仅 存在 的 问题 希望 这 个 按钮 应 该 继承 一 个 
或 两 个 引用 点 。 


我 们 使 用 标准 化 C 语 言 拥 有 很 大 的 优点 : 它 会 使 这 样 的 事实 很 明显 ， 即 ， 继 承 一 一 多 重 或 其 他 
总 是 伴随 着 包含 而 进行 。 和 包含 ， 然 而 也 能 作为 集合 被 实现 。 与 复杂 化 语言 定义 和 增加 过 量 实 
现 相 比 多 重 继承 对 于 程序 员 来 说 要 做 的 更 多 ， 这 一 点 也 不 清晰 。 我 们 将 使 得 事情 变 得 简单 兵 
器 只 做 简单 的 继承 。 第 14 章 将 首要 展示 多 重 继承 的 使 用 ， 库 的 合 入 能 够 被 集合 和 消息 转换 所 
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第 五 章 编程 经 验 一 一 符号 表 


来 源 : https://github.com/oxnz/ooc/blob/master/tex/chapter0x05.tex 
译 者 : Oxnz 


一 个 结构 体 明 智 的 加 长 , 以 此 来 共享 基本 结构 的 功能 , 可 以 帮助 省 去 策 重 的 Union 的 使 用 9 
特别 在 具有 动态 绑 定 ， 我 们 得 到 了 一 种 统一 的 且 完 美 健壮 的 方式 处 理 消息 传递 。 一 旦 基本 机 
制 就 位 ， 一 个 新 的 扩展 类 就 可 以 重用 基本 代码 容易 的 添加 。 


作为 一 个 例子 ， 我 们 将 会 添加 关键 字 、 常 量 、 变 量 和 数学 函数 到 第 三 章 开 始 的 小 计算 器 中 。 
所 有 这 些 对 象 存在 一 个 符号 表 中 并 且 共 享 相同 的 名 称 搜索 技术 。 


扫 瞄 标识 符 


在 3.2 节 中 我 们 实现 了 函数 scan() ， 从 主 程序 获取 一 行 输入 并 在 每 次 调用 返回 一 个 输入 符 
号 。 如 果 我 们 想 引 进 关键 字 ， 命 名 常量 等 等 ， 我 们 需要 扩展 scan) 。 像 浮 点 数 一 样 ， 我 们 提 
取 字 符 数 字 囊 以 供 深入 分 析 : 


#define ALNUM "ABCDEFGHIJKLMNOPQRSTUVWXYZ" \ 
"abcdefghijklmnopqrstuvwxyz" N 
"_" "0123456789" 


static enum tokens scan (const char * buf) { 
static const char * bp; 


if (isdigit(* bp) || * bp == '.') 
else if (isalpha( “bp) || “bp == '_') { 
char buf[BUFSIZ]; 
int len = strspn(bp, ALNUM); 


if (len >= BUFSIZ) 
error("name too long: %-.10s..", bp); 


strncpy(buf, bp, len), buf[len] = 'No', bp += len; 
token = screen(buf); 


一 旦 我 们 有 了 一 个 标识 符 ， 我 们 让 新 函数 screen() 来 决定 它 的 token 值 应 当 是 什么 。 如 果 有 
必要 ， Screen( ) 将 会 存放 一 个 解析 器 可 以 识别 的 符号 描述 到 全 局 变量 symbol 中 


使 用 变量 


一 个 变量 参与 两 个 操作 : 它 的 什 被 用 作 一 个 表达 式 的 操作 数 ， 或 者 表达 式 的 赋 值 对 象 。 第 一 
中 操作 是 对 3.5 节 中 一 个 简单 的 factor() 扩展 。 


static void “ factor (void) { 
void * result; 


switch (token) { 
case VAR: 


result = symbol; 
break; 


VAR 是 一 个 当 screen() 发 现 适当 的 标识 符 的 时 候 放 到 token 中 的 唯一 值 。 有 关 标 识 符 的 附加 
信息 被 放 到 全 局 变量 Symbol 中 。 在 这 种 情况 下 ， symbol 包含 一 个 节点 来 标示 变量 作为 表达 式 
树 中 的 一 个 叶子 。 screen) 要 么 找到 变量 再 符号 表 中 或 者 使 用 描述 var 去 创建 它 。 


识别 一 个 赋值 有 点 复杂 。 如 果 我 们 的 计算 器 允许 如 下 两 种 语法 的 声明 ， 它 将 会 是 舒适 的 : 


asgn : sum 
| VAR = asgn 


不 幸 的 是 ，VAR 也 可 以 出 现在 sum 的 左 端 ， 也 就 是 说 ， 使 用 我 们 递归 下 降 的 技术 如 何 识 别 C 
风格 睹 入 赋值 不 是 立即 就 能 清楚 的 。 因 为 我 们 想 要 学 到 如 何 操作 关键 字 ， 我 们 设置 如 下 的 语 
法 : 


这 里 有 一 个 技巧 : 对 sum 做 简单 尝试 。 如 果 返 回 是 下 一 个 输入 符号 是 = ， sum 必定 是 
一 个 变量 叶子 节点 ， 我 们 就 可 以 创建 这 个 赋值 。 


stmt : sum 
| LET VAR = sum 


这 被 翻译 成 如 下 函数 : 


static void * Stmt (void) { 
void * result; 


switch (token) { 
case LET: 
if (scan(0) != VAR) 
error("bad assignment"); 
result = symbol; 


if (scan(0) != '=') 
error("expecting ="); 
scan(0): 
return nen(Assign, result, sum()): 
default: 


return sum(); 
} 18 this i s comet “7 


在 主 程序 中 我 们 调用 stmt 来 替代 sum) ， 并 且 我 们 的 识别 器 已 经 准备 好 操作 变 
量 。 Assign 是 一 个 新 的 类 型 描述 来 计算 一 个 Sum 的 值 并 赋值 给 一 个 变量 f 


ji F-- Name 


赋值 具有 如 下 语法 : 


Stmt : Sum 
| LET VAR = Sum 


LET 是 关键 字 的 一 个 例子 。 在 构建 第 子 的 过 程 中 我 们 仍然 可 以 决定 什么 标识 符 将 标 

FR LET: scan() 从 输入 行 提 取 一 个 标识 符 并 传递 给 screen() ， 是 它 在 符号 表 中 查找 并 返 

E) token 的 适当 值 ， 至 少 一 个 变量 ， 一 个 节点 在 symbol 中 。 

识别 器 丢弃 LET 但 是 插入 变量 作为 叶子 节点 在 树 中 。 对 于 另 一 个 符号 ， 例 如 一 个 算数 函数 的 
名 称 ， 我 们 可 能 想 要 适用 new() 到 screener de ng dh 点 。 因 此 ， 我 们 的 
符号 表 入 口 应 当 对 与 大 部 分 具有 相同 的 函数 动态 绑 定 与 我 们 树 节 


对 于 一 个 关键 字 ， 一 个 Name 需要 包含 输入 字符 串 和 token 值 。 稍 后 我 们 想 要 继承 Name ; 
此 ， 我 们 定义 结构 在 Name.r 中 : 


struct Name { /* base structure */ 
const void * type; /* for dynamic linkage */ 
const char * name; /* may be malloc-ed */ 


int token; 


}; 


我 们 的 符号 从 不 死亡 : 他 们 的 名 字 是 预定 义 的 常量 字符 囊 还 是 存储 的 用 户 自 定义 变量 动态 字 
符 串 是 没有 关系 的 -- 我 们 将 不 会 回收 他 们 。 


在 我 们 可 以 定义 一 个 符号 之 前 ， 我 们 需要 输入 它 到 符号 表 。 这 不 能 通过 调 

用 new(Name，...) 来 处 理 ， 因 为 我 们 想 要 支持 更 多 比 name i ， 并 且 我 们 想 要 隐藏 符 
号 表 的 实现 。 相 反 的 ， 我 们 提供 一 个 函数 install() ， 它 需要 一 个 name 对 象 并 把 它 插入 到 符 
号 表 中 。 这 里 给 出 符号 表 接 口 文件 Name.h 


extern void * symbol; /* -> last Name found by screen() */ 
void install (const void * symbol); 
int screen (const char * name); 


识别 器 必须 插入 像 LET 的 关键 字 到 符号 表 中 ， 在 他 们 被 screener 发 现 之 前 。 这 些 关键 字 可 以 
被 定义 进 一 个 常量 表 结 构 中 -- 它 对 install() 没有 影响 。 下 面 的 函数 被 用 来 初始 化 识别 : 


#include "Name.h" 
#include "Name.r" 


static void initName (void) { 
static const struct Name names [] = { 
oe Ua IL NË 
0 


Ha 


const struct Name * np; 


for (np = names, np->name; ++np) 
install(np): 


注意 names[] ， 关 键 字 表 ， 不 需要 被 存储 。 我 们 适用 name 的 标示 来 定义 names[] ， 也 就 是 
说 ， 我 们 包含 Name.r 。 由 于 关键 字 LET 被 丢弃 ， 我 们 不 提供 动态 绑 定 的 方法 。 


父 类 的 实现 -- Name 


通过 名 字 搜 索 符 号 是 一 个 标准 问题 。 不 幸 的 是 ，ANSI 标 准 没 有 定义 一 个 合适 的 库 函 数 来 解决 
它 。 bsearch() -- 有 序 表 中 的 二 分 查找 -- 比 较 接近 ， 但 是 如 果 我 们 想 要 插入 一 个 单独 的 新 符 
号 ， 我 们 不 得 不 调用 qsort() 来 设置 阶段 给 后 续 搜索 。 


UNIX 系 统 很 可 能 提供 两 三 个 函数 家 族 来 处 理 动态 增长 表 。 lsearch() -- 线 性 搜索 一 个 数组 并 
在 end(!) 添加 -- 不 是 完全 高 校 的 ° hsearch() ——NË 告 构 体 哈 希 表 由 一 个 文本 和 一 个 信息 息 指 针 
e EE — HË KL AJ të FIIKA TI 9 tsearch() -- 一 人 ?1 二 又 树 具 有 
任意 比较 和 删除 -- 是 最 常用 的 家 族 但 是 很 没有 效率 ， 如 果 初 始 符号 从 一 个 有 序 序列 中 安装 。 


在 一 个 UNIX 系 统 上 ， tsearch() 有 可 能 是 最 好 的 折 训 。 对 于 一 个 可 移植 的 实现 具有 二 元 线程 
树 可 以 在 [sch87] 找到 。 然 而 ， 如 果 这 个 家 族 不 可 用 ， 或 者 如 果 我 们 不 能 保证 一 个 随机 的 初 
始 化 ， 我 们 应 当 查 看 一 个 简单 的 设备 来 实现 。 一 个 小 心 实现 的 bsearch() 可 以 很 容易 的 被 扩 
展 来 支持 存储 的 数组 插入 : 


void * binary (const void * key, 
void “ base, size_t * help, size_t width, 
int (* cmp) (const void * key, const void * elt)) { 
size_t nel = * nelp; 
tdefine base (* (char **) & base) 
char * lim = base + nel * width，* high, 


if (nel > 0) { 
for (high = lim - width; base <= high; nel >>= 1) £ 
char * mid = base + (nel >> 1) * width; 
int c = cmp(key, mid); 


if (c < 0) 

high = mid - width; 
else if (c > 0) 

base = mid + width, --nel; 
else 

return (void *) mid; 


到 这 里 为 止 ， 这 是 一 个 任意 数组 的 二 元 搜索 。 key 只 想 要 找 的 对 象 ; base 初始 值 是 一 个 具 
有 *nelp 个 元 素 的 表 的 开始 位 置 ， 每 个 元 素 width 字 节 ; 并 且 cmp 是 一 个 函数 用 来 比 

较 key 和 一 个 表 中 的 元 素 。 在 此 我 们 要 么 找到 一 个 元 素 并 返回 它 的 位 置 ， 要 么 base 现在 
是 key 应 当 出 现在 表 中 的 位 置地 址 。 我 们 继续 如 下 : 


memmove(base + wdith, base, lim - base): 


tt T nelpj 
return memcpy(base, key, width); 
tundef base 


} 


memmove() 移动 数组 的 末尾 ， memcpy() 插入 key 。 我 们 假定 数组 之 外 还 有 空间 并 且 我 们 


过 nelp 纪录 我 们 已 经 加 入 了 一 个 元 素 -- binary() 和 标准 函数 bsearch() 只 需要 地 址 而 不 
量 的 值 包含 狐 了 表 中 元 素 的 个 数 。 


通 


memmove() 复制 字 节 即使 源 和 目标 区 域 重 三 ; mencpy() 并 不 如 此 ， 但 是 它 更 具 效率 


给 出 一 个 通用 搜索 和 入 口 的 方式 ， 我 们 可 以 很 轻易 的 管理 我 们 的 符号 表 。 首 先 我 们 需要 比较 
一 个 key 和 表 中 的 元 素 : 
static int cmp (const void * key, const void * elt) { 
const char * const * key = key: 


const struct Name * const * elt = elt, 


return strcmp(* key, (* elt) -> name); 


作为 一 个 键 值 ， 我 们 只 传递 一 个 指向 输入 符号 文本 的 指针 的 地 址 。 表 中 的 元 素 当然 是 Nane 
结构 体 ， 并 且 我 们 只 查看 他 们 的 .name 成员。 


搜索 和 入 口 通过 适用 适当 的 参数 对 binary() 进行 调用 来 实现 。 由 于 我 们 事先 不 知道 符号 个 
数 ， 我 们 确保 一 直 有 空间 让 我 们 扩招 表 : 


static struct Name ** search (const char ** name) { 
static const struct Name ** names, /* dynamic table “7 
static size_t used, max; 


if (used >= max) { 
names = names 
? realloc(names, (max *= 2) * sizeof * names) 
: malloc((max = NAMES) * sizeof * names); 
assert(names); 


return binary(name, names, & used, sizeof * names, cmp); 


NAMES 是 一 个 定义 的 常量 具有 初始 分 配 的 表 项 ; 每 次 我 们 用 完 ， 我 们 都 是 表 的 大 小 加 倍 。 


search() 适用 指向 要 查找 的 文本 的 地 址 指针 作为 参数 并 且 返 回 表 项 的 地 址 。 如 果 文 本 未 找 

到 ， binary() 就 插入 key -- 也 就 是 说 ， 只 有 指向 文本 的 指针 ， 而 不 是 一 个 struct Name -- 到 表 
中 。 这 个 策略 是 为 了 screen() 的 利益 ， 它 只 新 建 一 个 表 元 素 ， 如 果 一 个 输入 中 的 标识 符 是 未 
知 的 : 


int screen (const char * name) { 
struct Name ** pp = search(8 name): 


if (Y pp == (void *) name) /* entered name “7 
* pp = nen(Var, name): 

symbol = * pp; 

return (* pp) -> token; 


screen() 让 search() 查找 要 显示 的 输入 符号 。 如 果 指 符号 文本 的 指针 被 插入 符号 表 ， 我 们 
需要 使 用 一 个 新 标识 符 的 项 目 描述 替换 它 。 


对 于 screen() ， 一 个 新 的 标识 符 必 须 是 一 个 变量 。 我 们 假定 这 里 有 一 个 类 型 描述 var 知道 如 
何 构建 Name 结构 体 来 描述 变量 并 且 我 们 让 new 做 剩 下 的 工作 。 其 他 的 情况 ， 我 们 
让 symbol 指向 符号 表 项 并 且 返 回 它 的 .token JË ° 

void install (const void * np) { 


const char * name = ((struct Name *) np) -> name; 
struct Name ** pp search(& name); 


if (* pp != (void *) name) 
error("cannot install name twice: %s", name); 
* pp = (struct Name *) np; 


install() 比较 简单 。 我 们 接受 一 个 Name 对 象 并 且 让 search() 在 符号 表 中 找到 
它 。 install() 被 假定 来 只 处 理 新 符号 ， 所 以 我 们 应 当 总 是 能 够 插入 对 象 替换 它 的 名 字 。 否 
则 ， 如 果 search() 真 的 找到 一 个 符号 ， 我 们 就 有 麻烦 了 。 


类 的 事先 --Var 


screen() 调用 new() 来 创建 一 个 新 的 变量 符号 并 且 返 回 它 到 识别 器 ， 并 插入 它 到 一 个 表达 式 
树 中 。 因 此 ，var 必须 创建 可 以 项 节点 行为 的 符号 表 项 ， 也 就 是 说 ， 当 定义 struct Var 的 时 
候 ， 我 们 需要 扩展 一 个 struct Name 来 继承 在 符号 表 中 存在 的 能 力 并 且 我 们 必须 支持 动态 绑 定 
的 函数 可 以 适用 于 表达 式 节点 。 我 们 描述 接口 在 var.h P: 


const void * Var 
const void * Assign; 


一 个 变量 具有 一 个 名 字 和 一 个 值 。 如 果 我 们 计算 一 个 算术 表达 式 的 值 ， 我 们 需要 返 
回 .value 成 员 。 如 果 我 们 删除 一 个 表达 式 ， 我 们 一 定 不 能 删除 变量 节点 ， 因 为 它 存活 在 符号 
表 中 : 

struct Var { struct Name _; double value; }; 

#define value(tree) (((struct Var *) tree) -> value) 


static double doVar (const void * tree) { 
return value(tree); 


} 


static void freeVar (void * tree) { 


} 


就 如 在 4.6 节 中 讨论 的 ， 通 过 提供 一 个 值 的 访问 函数 来 简化 代码 o 


创建 一 个 变量 需要 分 配 一 个 struct var ， 插 入 一 个 变量 名 的 动态 副本 ， 并 且 标 识 值 var 被 识 


别 器 规定 : 


static void “ mkVar (va list ap) £ 
struct Var * node = calloc(1, sizeof(struct Var)); 
const char * name = va arg(ap, const char *); 
size_t len = strlen(name): 


assert(node): 

node-> _.name = malloc(len + 1): 
assert(node -> _.name); 

strcpy((void *) node-> _.name, name); 
node -> _.token = VAR; 

return node; 


} 


static struct Type _Var = { mkVar, doVar, freeVar ): 


const void * Var = & Var; 


new() 有 照料 插入 var 类 型 描述 到 节点 中 ， 在 符号 被 screen() 返回 之 前 或 者 任何 的 使 用 e 


就 技术 而 言 ， mkVar () 是 Name 的 构建 子 。 然 而 ， 只 有 变量 名 需要 被 动态 存储 。 因 为 饿 哦 我 们 
决定 在 我 们 的 计算 器 中 构建 子 负责 分 配 一 个 对 象 ， 我 们 不 能 让 var 构建 子 调 用 一 个 name 构 
建 子 来 维护 . name 和 .token 成 员 -- 一 个 Name 构建 子 将 会 分 配 一 个 Struct Name 而 不 是 一 


个 struct Var ° 


赋值 


赋值 是 一 个 二 元 操作 。 识 别 器 保证 我 们 具有 一 个 变量 作为 做 操作 数 和 sum 作为 右 操作 数 。 
此 ， 我 们 世纪 需要 实现 的 是 实际 赋值 操作 ， 也 就 是 说 ， 动 态 绑 定 进 类 型 描述 的 .exec 成 员 : 


tinclude "value.h" 
tinclude "value.r" 


static double doAssign (const void * tree) { 


return value(left(tree)) = exec(right(tree)): 
} 


static struct Type _Assign = { mkBin, doAssign, freeBin }; 
const void * Assign = & _Assign; 


我 们 共享 Bin 的 构建 子 和 析 构 子 ， 因 此 ， 在 算数 操作 的 实现 中 必须 是 全 局 的 。 我 们 也 共 

享 struct Bin 和 访问 函数 left) 和 right() 。 所 有 这 些 使 用 value.h 导出 并 且 实 现 文 

fr value.r 。 我 们 自己 的 访问 函数 value() 对 于 struct var 故意 的 允许 修改 ， 如 此 赋值 就 可 
以 被 很 优雅 的 实现 。 


另 一 个 子 类 -常量 


谁 会 喜欢 输入 pi 或 者 其 他 数学 常量 的 值 呢 ? ORRA s hoc [K&P84] 得 到 线索 
并 且 预 定义 一 些 常量 给 我 们 的 计算 器 。 下 面 的 函数 需要 被 调用 在 初始 化 识别 器 期 间 : 


void initconst (void) { 
static const struct Var constants I) = £ /* like hoc */ 
{ & Var, "PI", CONST, 3.14159265358979323846 }, 


9 }; 
const struct Var * vp; 


for (vp = constants; vp -> _.name; ++ vp) 
install(vp); 


变量 和 常量 几乎 是 一 样 的 : 都 具有 名 称 和 值 并 且 存 活 在 符号 表 中 ; 都 返回 他 们 的 值 在 一 个 算 

数 表 达 式 的 使 用 中 ; 并 且 都 不 应 当 被 删除 ， 当 我 们 删除 一 个 算数 表达 式 的 时 候 。 然 而 ， 我 们 

不 应 当 给 常量 赋值 ， 所 以 我 们 需要 同意 一 个 新 的 标识 符 值 const ， 识 别 器 在 factor) 中 接受 
就 像 VAR 一 样 ， 但 是 不 允许 在 stmt() 的 赋值 的 左边 。 


数学 有 函数 --Math 


ANSI-C 定 义 了 许多 数学 函数 例如 sin) ，sqrt() ，exp() 等 等 。 作 为 另 一 个 继承 的 练习 ， 我 们 
将 添加 库 函 数 使 用 一 个 单个 double 参数 并 且 具 有 一 个 double 结构 到 我 们 的 计算 器 。 


这 些 函 数 工作 的 就 如 同一 元 运算 符 一 样 。 我 们 可 以 定义 一 个 新 的 类 型 给 节点 给 每 个 函数 并 且 
收集 大 多 数 功 能 从 Minus 和 Name 类 ， 但 是 这 里 有 一 个 更 简单 的 方法 。 我 们 扩 
展 struct Name 到 struct Math 如 下 : 
struct Math { struct Name _; 
double (* funct) (double): 


}; 
#define funct(tree) (((struct Math *) left(tree)) -> funct) 


额外 的 给 函数 名 称 用 于 输入 和 标识 符 给 识别 ， 我 们 存储 像 sin() 的 库 函 数 的 地 址 在 符号 表 项 
中 。 


在 初始 化 期 间 我 们 调用 下 面 的 函数 来 输入 所 有 的 函数 描述 到 符号 表 中 : 


tinclude <math.h> 
void initMath (void) { 
static const struct Math functions I) = { 
{ & Math, "sqrt", MATH, sqrt }, 
9 }; 
const struct Math * mp; 


for (mp = functions; mp -> _.name; ++ mp) 
install(mp); 


一 个 函数 调用 是 一 个 因子 就 好 像 使 用 一 个 减 号 标记 一 样 。 对 于 识别 我 们 需要 扩展 我 们 的 语法 
对 因子 : 


factor : NUMBER 
| - factor 


JË an 
| MATH ( sum ) 


MATH 是 公共 标识 符 对 所 有 函数 输入 通过 initmath() 。 这 个 翻译 到 下 面 的 附加 factor) 在 识 
别 器 中 : 
static void * factor (void) { 
void * result; 


switch (token) { 


case MATH: 
{ 
const struct Name * fp = symbol; 
if (scan(0) iz '(') 
error (''expecting ("); 
scan(0): 
result = new(Math, fp, sum()); 
if (token != ')') 
error (''expecting )"); 
break; 


w 


symbol 首先 包含 符号 表 元 素 对 一 个 函数 例如 sino 。 我 们 保存 这 个 指针 并 且 构 建 表达 式 树 对 
于 函数 参数 通过 调用 sum() 。 然 后 我 们 使 用 math ， 类 型 描述 给 函数 ， 并 且 让 new() 构建 下 
面 的 节点 给 表达 式 树 : 


我 们 让 一 个 二 元 节点 的 左边 只 想 符 号 表 元 素 给 函数 并 且 我 们 附加 参数 树 在 右边 。 这 个 二 元 节 
点 具有 Math 作为 类 型 描述 ， 也 就 是 说 ， 方 法 doMath() 和 freeMath() 将 会 被 调用 来 分 别 执行 
和 删除 节点 。 


Math 节 点 仍然 使 用 mkBin() 构建 ， 因 为 这 个 函数 不 关心 指针 的 后 代 。 freemath() ， 然 而 ， 可 
能 只 会 删除 右 子 树 : 


static void freeMath (void * tree) { 
delete(right(tree)): 
free(tree): 


如 果 我 们 仔细 看 上 图 ， 我 们 可 以 看 到 一 个 math 节点 的 执行 是 非常 容易 的 。 doMath() 需要 调 
用 存储 在 符号 表 中 元 素 可 以 被 访问 的 作为 左 后 代 二 元 节点 从 之 被 调用 : 


static double doMath (const void * tree) { 
double result = exec(right(tree)): 


errno = Q; 
result = funct(tree)(result); 
if (errno) 
error("error in %s: %s", 
((struct Math *) left(tree)) -> _.name, 
strerror(errno)); 
return result; 


唯一 的 问题 是 抓 住 数字 错误 通过 检测 errno 变量 在 ANSI-C 头 文件 errno.h 中 声明 。 这 个 完成 
了 数学 函数 的 实现 给 计算 器 。 


Ex 


总 结 

机 遇 一 个 函数 binary() 来 搜索 和 插入 一 个 有 序数 组 ， 我 们 实现 了 一 个 符号 表 包 含 了 就 读 够 体 
有 具 有 名 称 和 标识 符 值 。 继 承 允许 我 们 插入 其 他 结构 体 到 表 中 而 不 需要 改变 函数 搜索 和 插入 。 
这 种 方式 的 高 雅 变 得 明显 一 旦 我 们 考虑 一 个 传统 的 定义 一 个 符号 表 元 素 出 于 我 们 的 目的 : 


struct £ 
const char * name, 
int token; 
union { /* based on token “7 
double value: 
double (* funct) (double): 
} u; 
J; 


对 于 关键 字 ， union 是 没有 必要 的 。 用 户 定义 的 函数 讲 会 要 求 一 个 更 详细 的 描述 ， 并 且 引 
用 union 的 部 分 是 讨厌 的 S: 


继承 允许 我 们 适用 符号 表 功 能 到 新 的 项 而 不 改变 已 经 存在 的 代码 。 动 态 绑 定 在 许多 方式 帮助 
保持 实现 的 简单 性 : 常量 符号 表 元 素 ， 变 量 和 函数 可 以 被 绑 定 进 表 达 式 树 中 而 不 用 担心 我 们 
TEMRE: 一 个 执行 兄 数 参考 自身 值 有 它 自己 安排 节点 。 


练习 


新 关键 字 是 必须 的 用 来 实现 例如 while 或 者 repeat 循环 ，if 语句 等 等 。 识 别 被 stmt() 处 
理 ， 但 是 这 个 对 于 大 部 分 情况 ， 只 有 一 个 问题 编译 器 构建 ， 而 不 是 继承 。 一 旦 我 们 决定 语句 
描述 ， 我 们 将 创建 节点 类 型 例如 While ， Repeat 或 者 IfElse ， 并 且 关 键 字 在 符号 表 中 不 需 
要 知道 他 们 的 存在 。 


更 有 趣 的 是 函数 具有 两 个 参数 的 例如 atan2() 在 ANSI-C 数 学 库 中 。 从 这 里 看 出 符号 表 ， 这 个 
函数 被 处 理 仅 仅 类 似 简单 函数 ， 但 是 对 于 表达 式 树 我 们 需要 开发 一 个 新 的 节点 类 型 使 用 三 个 
后 代 。 


用 户 定 义 的 函数 具有 一 个 现实 的 有 意思 的 问题 。 如 果 我 们 表示 单独 的 参数 通过 $ 并 且 我 们 使 
用 一 个 节点 类 型 parm 来 只 想 函 数 项 在 符号 表 中 从 那里 我 们 可 以 暂时 存储 参数 值 只 要 我 们 不 允 
许 递归 ， 就 是 简单 的 。 遂 数 具 有 参数 名 和 几 个 参数 是 比较 困难 的 ， 当 然 了 。 然 而 ， 这 是 一 个 
好 的 练习 inverstigate 继承 的 好 处 和 动态 绑 定 的 好 处 。 我 们 将 在 第 11 章 中 返回 到 这 个 问题 。 


